超节点火爆国产AI算力跑出追赶新路线

超节点技术趋势 - 华为首次展出昇腾384超节点真机Atlas 900 A3 SuperPoD 集成384颗昇腾NPU和192颗鲲鹏CPU 算力规模达300 PFLOPs 接近英伟达GB200 NVL72系统的2倍[1] - 超节点通过高速网络MatrixLink全对等互联实现大规模并行计算有效支撑万亿参数大模型与多模态训练需求[3][5] - 超节点采用Scale Up和Scale Out两种路径构建通过高密度机柜部署或光互连跨机柜扩展单机柜最高可部署128颗GPU[5][6][7] 国产厂商超节点方案 - 沐曦科技推出Shanghai Cube国产高密度液冷整机柜采用47U单机柜4组超节点单机柜128颗GPU 8机柜组成千卡集群[7] - 新华三发布超节点产品H3C UniPod S80000 实现单机柜64卡高密部署具备向1024卡互联演进能力[7] - 超聚变展出全球首个多元智算即插即用超级集群系统单柜128个AI加速卡支持112G/224G高速互连节能20%以上[8] - 中兴通讯联合多家企业发布国内首个光互连光交换GPU超节点光跃LightSphere X 单机柜搭载64颗GPU[7] 国产AI芯片合作生态 - 阶跃星辰发起"模芯生态创新联盟" 首批成员包括华为昇腾、沐曦、壁仞科技等推动国产芯片与模型协同优化[11] - 四大国产AI芯片厂商（沐曦、天数智芯、燧原科技、壁仞科技）首度同台合作共同提供高效大模型解决方案[2][11] - 沐曦推出曦云C600通用GPU 燧原科技发布通推一体L600AI芯片国产芯片进入百花齐放阶段[9][2] 算力集群技术演进 - 超节点作为Scale Up最优解通过内部高速总线互连加速GPU间参数交换缩短大模型训练周期[3][5] - 摩尔线程提出"AI工厂"理念构建夸娥集群系统最高支持10240个全功能GPU部署覆盖全精度计算场景[9] - 国产算力需跨行业协作涉及网络技术、全光互连、分布式并行计算等系统化解决方案[10][12]