行业趋势与核心观点 - 人工智能正从“模型驱动”迈向“工程驱动”,科学大模型、世界模型、垂类大模型成为新方向,但面临高端AI硬件供给受限、软硬件生态割裂、算力成本高昂等“性能墙”和“生态墙”制约 [2] - 产业链正聚焦“开放架构”,通过建立统一技术标准与开放协同生态,打破壁垒,实现从芯片、系统到应用的全栈优化与高效协同 [2] - 2025年是国产AI计算从“单点突破”转向“体系输出”的关键一年,2026年行业技术、生态将全速演进 [19] - AI计算竞争已进入“体系化竞争”阶段,需通过开放路线实现从芯片、服务器、网络到软件的全栈协同,构建产业链上下游的“价值闭环” [7] 硬件创新与系统突破 - 中科曙光首次亮相国产万卡级AI集群系统真机scaleX万卡超集群,部分技术能力已超越海外头部企业 [3] - scaleX万卡超集群由16个超节点构成,可支撑部署10240块AI加速卡,总算力超5EFLOPS,单机柜算力密度提升20倍,PUE(电能利用效率)低至1.04 [3] - scaleX基于“AI计算开放架构”设计,可支持多品牌加速卡及主流计算生态,并实现对超过400个主流大模型、世界模型的适配优化 [3] - 中科曙光表示其超节点出货情况良好,明年预定量持续提升,随着CPU/GPU功耗提升,液冷技术(冷板/浸没)将成为主要发展方向 [3] - 过去两年国产算力增速超10倍,但需在硬件集成度、散热效率、网络通信等系统级架构上突破以提升整体占比 [4] - 2026年GPU单机功率将持续上升,冷板式与浸没式液冷将成为主流,开放架构下的高密度集成是应对之道 [4] - 从“单机柜”到“万卡集群”的演进是系统性工程创新,突破了算力规模扩张瓶颈,标志着竞争进入比拼系统工程能力、软件协同与生态构建的新阶段 [4] 软件生态与开放协同 - 当前国产智算的瓶颈往往在软件层面,同时存在让中小企业和科研机构以合理成本用上高效算力的难题 [5] - 国产AI计算生态面临“应用迁移成本高、资源供需错配、生态不统一”三大挑战,不同技术路线需重复适配导致开发周期延长、成本上升 [6] - 光合组织推动的开放架构核心是通过统一接口与标准,让不同芯片、系统能够协同工作,降低生态碎片化负担 [6] - 产业链企业展示基于统一基础软件栈的适配方案,涵盖从AI框架、算子库到调度平台各层,存算传紧耦合优化与超集群智能调度引擎成为亮点 [6] - 通过向量数据库优化等技术推动端到端延迟显著降低,数字孪生运维平台可实现故障自主定位与修复,使超大规模集群可用性达99.99% [6] - 开放架构降低了生态门槛,但要在国际竞争中获得持续优势,仍需在标准主导权、应用生态丰富度、跨平台工具链成熟度上长期投入 [19] 产业合作与生态落地 - 中科曙光、商汤集团、麒麟软件、海光信息等企业达成多项战略合作,围绕AI算力软硬件系统优化、世界模型与具身智能应用创新等开启跨层开放协作 [8] - 科学智能联合攻关行动、AI计算开放架构联合实验室首批项目组协同创新计划等多项计划公布,针对科学大模型、多元异构算力融合、统一基础软件栈、超大规模集群优化等共性关键技术开展联合攻关 [8] - “光耀百城2.0”同步开启,将推动开放架构产品与解决方案在制造、能源、科研等领域的规模化落地,重点降低中小企业的使用门槛 [8] - 产业链企业对联合破局的氛围越发浓厚,共同攻关“开放架构”下的系统级软硬件适配难题,加速向智能制造、汽车等行业的应用落地与推广 [18] - 从边缘计算盒子到AI一体机,从智算集群到行业模型平台,展示出“全栈式国产AI计算生态全景图” [19]
直击HAIC 2025: 开放架构破“墙”而立 国产AI计算生态协同出击