文章核心观点 文章基于并行科技副总裁赵鸿冰在GAIR 2025大会上的演讲及后续访谈,阐述了当前算力市场的多业态发展、从用户视角构建算力服务体系的必要性,并重点介绍了并行科技通过“厂网结合”模式构建算力网络、实现全国范围资源高效调度与商业化的实践与思考 [2][3][4] 算力市场业态与用户需求 - 当前算力市场呈现多场景、多业态爆发式增长,已形成四大核心业态:算力租赁(基础形态,交付“裸金属”资源)、算力服务(按需提供,匹配业务场景)、算力运营(复杂调度平台管理)、算力网络(更高维度,跨平台整体调度)[3][24] - 从用户视角出发,核心诉求归结为三点:可用(稳定供应)、好用(高效性能)、降本(高性价比),所有产品平台均围绕这三大需求设计 [22][23] - 根据计算精度和场景,算力市场可分为四类:尖端超算(如“天河”,需十万/百万核级,FP64精度)、通用超算(万核以下,高校科研)、业务超算(企业仿真)、智算(GPU加速,FP16/FP8/FP4精度,增长最快)[18][19] 并行科技的商业模式与运营实践 - 公司采用“厂网结合”特色经营模式:“厂”指重资产布局(如自建万卡集群),“网”指轻资产扩张,连接国内47个智算中心与15个超算中心,总计62个算力节点 [4][27] - 其算力网络可调度资源总量超过200万CPU核心、5万多张GPU卡,服务用户规模突破16万,商业化输出累计超过200亿核时、近2亿卡时 [4][27] - 公司已打造成熟的算力资源接入标准体系,根据规模、调度能力等维度对资源分级,实现快速接入与网络化输出 [7] - 商业模式以清晰的价值分层驱动利益分配,产业链分为前端市场销售、产品平台层、售后服务层、底层重资产投资与IDC托管,合作伙伴可根据自身优势匹配对应价值环节 [8] 技术能力与资源选型 - 基于18年行业经验与数据积累,公司构建了算力性能预测模型,在小规模场景下预测误差控制在2%以内,中大规模场景误差为个位数,有效支撑用户资源选型决策 [4][35] - 资源选型核心原则是“没有绝对最优的算力资源,只有最适配的选择”,例如在具身智能场景实测中,H200的性价比可能优于性能领先的B200 [4][32] - 在大规模推理场景中,消费级显卡5090因其高性价比成为多数客户的首选 [4][36] - 针对异构算力虚拟化损耗问题,容器技术是主流解决方案,可实现近乎零损耗;对于有极致性能需求的客户,可直接采用裸金属或高性能集群 [9][10] 行业趋势与未来展望 - 人工智能是全球竞争制高点,算力规模年复合增长率达到52.3%,头部科技企业的FOMO情绪及对发展窗口期的担忧推动了适度超前的算力基建投入 [5][6] - 推理需求正成为下一波算力增长核心引擎,OpenAI 2025年预估营收达130亿美元是推理业务规模化发展的直接体现,行业正朝此方向迈进 [11] - 推理成为主流后,算力产业核心诉求将变化:除可靠性外,更需要大规模弹性资源调度能力和更精细的资源匹配能力(如针对DeepSeek推理P阶段与D阶段的不同特征) [12] - 超节点(如英伟达NVL72、华为384超节点)本质是小型化超级计算机,通过高密度集成与高速互联降低通信开销,其发展需要软硬协同,具备超算技术积累的企业更具优势 [13][14][15] - 国产芯片(如华为昇腾910B)在部分适配场景中性能可与A100比肩,且具备价格优势,能提供更高性价比选择 [40] 公司市场地位与客户布局 - 公司在算力服务企业中商业化输出总量位居第一 [27] - 核心客群覆盖国内前四五百所头部高校(如清华大学、复旦大学)、中科院旗下数百家研究所,以及美的、三一重工、比亚迪、小鹏汇天、智谱等知名企业 [43][45]
并行科技赵鸿冰:如何最大化发挥算力效益?丨GAIR 2025
雷峰网·2025-12-24 04:56