中国AI算力产业战略转向 - 中国AI算力产业正面临战略抉择,是从封闭技术栈追赶,还是开创基于开放协同的新竞争模式 [1] - 在首届光合组织人工智能创新大会上,中科曙光发布全球领先的scaleX万卡超集群,标志着中国主流算力厂商正集体转向以“开放架构”为核心的产业竞争新逻辑 [3] 行业当前困局 - 过去几年,在国产化政策与AI市场爆发的驱动下,各类厂商普遍陷入“全栈布局”的扩张冲动,导致严重的“全链内卷”,形成了接口不一、标准各异的“技术孤岛” [4] - 碎片化格局导致用户面临高昂的适配和优化成本以及艰难的选型困境,形成了供给端繁荣但需求端因迁移成本和不确定性而徘徊的悖论 [4] - 更深层挑战在于“性能墙”与“生态墙”的双重壁垒,单芯片性能存在客观代差,同时英伟达通过CUDA生态构筑了深厚的软硬件护城河和锁定效应 [4] - 生态的贫瘠使得算力难以转化为行业生产力,这是与国际竞争的关键缺口 [5] 破局之道:开放架构与分层解耦 - 破局之道被概括为从“立体计算”到“开放计算”的战略演进,核心是重构竞争基本单元,打造以共同标准、开放接口为纽带的“产业平台” [6] - 光合组织是这一平台的载体,旨在通过一套平衡竞争与合作的机制,保障成员在各自擅长领域攻关并开放成果获得收益,同时充当供需对接平台 [6] - 头部企业正做出战略收缩,中科曙光从一些竞争激烈的市场撤出,并计划进一步让利给友商 [6] - 中国头部IT企业正摒弃“大而全”模式,转向“精而强+生态赋能”的新定位,例如曙光聚焦超大规模系统架构、高速互连网络和系统级调度管理 [8] - 海光信息扮演“底座赋能者”角色,开放HSL总线协议,使其他AI芯片厂商能更便捷地与海光CPU互连,将CPU能力赋能给卡厂和用户 [8] - 开放架构的技术实现遵循“分层解耦”与“协同优化”原则,将全产业链难点分层解耦,由多个优秀厂商集群式攻关,最终各层之间重新形成紧耦合状态 [8] 技术突破与产品落地 - scaleX万卡超集群通过在系统架构、工程创新和网络互联等层面的“非对称突破”实现整体竞争力跃升 [8] - 全球首创单机柜640卡超高密度集成,通过浸没相变液冷等技术,将算力密度提升20倍,PUE降至1.04 [8] - 基于首款国产400G类InfiniBand芯片的scaleFabric网络,实现400Gb/s带宽、亚微秒延迟,性能对标国际主流,且部分能力超越海外同类产品研发路线图的2027年NVL576里程节点 [8] - 通过三级优化,将AI加速卡资源利用率提升55%,实现万级节点、十万级用户的管理,集群长期可用性达99.99%,运维从“被动告警”变为“主动预测” [9] 生态构建与市场策略 - 开放架构通过打造兼容多品牌加速卡和主流软件生态的“统一平台”,直接降低用户从封闭生态迁移或尝试国产算力的门槛,帮助客户节省成本并提升优化效率 [9] - 对于中小AI芯片设计公司、算法公司和行业ISV,加入开放架构意味着获得共享测试平台、认证体系、集成渠道和客户资源的“入场券”,能产生“生态虹吸”效应,快速汇聚创新力量 [9] - 开放架构将互联网和云服务商作为关键争夺对象,这些客户因采购规模巨大而希望有更多话语权,对开放路线和开源技术接受度更高 [10] - 海光推出了专门面向互联网客户的产品线,提供更深度的定制化服务,实现从“标准化供给”到“联合定制”的转变 [10] - 与封闭生态在通用大模型领域的路径不同,开放联盟更强调与金融、医疗、高端制造等垂直行业的深度结合,难点在于行业专家和AI应用专家的紧密结合 [10] 未来挑战与竞争本质 - 开放计算路径面临的核心挑战在于如何维持一个多元化平台的长期凝聚力和创新效率 [11] - 关键治理挑战在于设计公平、透明、可预期的规则,确保贡献者获得回报,防止“搭便车”行为 [12] - 需要界定组织成员之间“竞争前的合作”与“市场竞争”的边界 [12] - 分层解耦增加了系统级协同优化的复杂度,开放架构要求不同厂商的模块通过标准接口紧密协作并达到极致性能,协调难度更高 [12] - 在追赶过程中,还需要应对国际巨头持续快速的技术演进,在芯片能效等方面存在客观差距 [12] - 开放架构的成败最终取决于市场是否买单,需要证明其综合体验不亚于甚至优于封闭生态,形成正向循环 [13] - 这场竞争的本质是两种产业组织模式的较量:基于垂直整合、软硬件深度绑定的“中心化控制”模式,与基于开放标准、模块化分工、生态化协作的“分布式创新”模式 [14] - 中国产业界选择的开放路径,是基于对自身最完整的电子信息制造产业链、最丰富的AI应用场景以及大量细分领域中小企业的深刻认知,旨在通过开放架构系统化组织分散优势,爆发创新能量 [14] - 这一转变是从“单点突破”走向“集群创新”,旨在通过开放架构降低智算集群研发门槛,从技术“单点突围”走向产业“生态共进” [14]
scaleX万卡超集群落地 中国AI算力格局从“单点突围”转向“生态博弈”