超节点技术趋势 - 华为首次展出昇腾384超节点真机Atlas 900 A3 SuperPoD 集成384颗昇腾NPU和192颗鲲鹏CPU 算力规模达300 PFLOPs 接近英伟达GB200 NVL72系统的2倍[1] - 超节点通过高速网络MatrixLink全对等互联 实现大规模并行计算 有效支撑万亿参数大模型与多模态训练需求[3][5] - 超节点采用Scale Up和Scale Out两种路径构建 通过高密度机柜部署或光互连跨机柜扩展 单机柜最高可部署128颗GPU[5][6][7] 国产厂商超节点方案 - 沐曦科技推出Shanghai Cube国产高密度液冷整机柜 采用47U单机柜4组超节点 单机柜128颗GPU 8机柜组成千卡集群[7] - 新华三发布超节点产品H3C UniPod S80000 实现单机柜64卡高密部署 具备向1024卡互联演进能力[7] - 超聚变展出全球首个多元智算即插即用超级集群系统 单柜128个AI加速卡 支持112G/224G高速互连 节能20%以上[8] - 中兴通讯联合多家企业发布国内首个光互连光交换GPU超节点光跃LightSphere X 单机柜搭载64颗GPU[7] 国产AI芯片合作生态 - 阶跃星辰发起"模芯生态创新联盟" 首批成员包括华为昇腾、沐曦、壁仞科技等 推动国产芯片与模型协同优化[11] - 四大国产AI芯片厂商(沐曦、天数智芯、燧原科技、壁仞科技)首度同台合作 共同提供高效大模型解决方案[2][11] - 沐曦推出曦云C600通用GPU 燧原科技发布通推一体L600AI芯片 国产芯片进入百花齐放阶段[9][2] 算力集群技术演进 - 超节点作为Scale Up最优解 通过内部高速总线互连加速GPU间参数交换 缩短大模型训练周期[3][5] - 摩尔线程提出"AI工厂"理念 构建夸娥集群系统 最高支持10240个全功能GPU部署 覆盖全精度计算场景[9] - 国产算力需跨行业协作 涉及网络技术、全光互连、分布式并行计算等系统化解决方案[10][12]
超节点火爆 国产AI算力跑出追赶新路线
中国经营报·2025-08-04 07:26