灵衢互联协议

搜索文档
华为超节点:用「一台机器」的逻辑,驱动AI万卡集群
机器之心· 2025-09-19 13:23
超节点架构创新 - 华为基于自研灵衢互联协议创新超节点架构 重新定义大规模有效算力新范式[3][12] - 超节点通过多机物理组合实现逻辑单一设备 统一通信协议与内存编址实现全局资源池化[9] - 架构将通信时延降至百纳秒级 解决传统集群因带宽不足和时延大导致的算力利用率下降问题[5][11] 技术突破与性能表现 - 超节点采用UB-Mesh递归直连拓扑 支持8192卡无收敛全互联 总互联带宽达16PB/s(超全球互联网峰值带宽10倍)[20] - FP8算力达8E FLOPS 支持百万卡规模集群 成为全球最强算力集群之一[20] - 在万亿模型训练中减少40%通信等待时间 显著提升集群利用率和系统可靠性[5][11] 产品矩阵覆盖全场景 - Atlas 950/960 SuperPoD支持8192/15488张昇腾卡 采用全液冷和零线缆电互联设计 解决高密度散热和跨柜部署难题[17][19] - Atlas 850为业界首款企业级风冷超节点服务器 支持1024卡集群 降低企业部署门槛[21] - Atlas 350标卡通过4个灵衢端口实现多卡互联 推荐推理性能提升2.5倍[24] - TaiShan 950 SuperPoD将超节点扩展至通用计算领域 支持数据库和大数据等低延迟场景[25] 生态战略与落地进展 - 推行硬件开放与软件开源战略 将NPU模组和昇腾CANN等核心组件开源[27][28] - 基于灵衢的Atlas 900 A3超节点已累计部署300多套 服务20余个行业客户[28] - 生态覆盖互联网、金融、运营商、电力及制造等多行业[28]