Atlas 960 SuperPlus集群

搜索文档
华为AI芯片计划全盘托出!全球最强超节点+超级集群,未来2年全面领先
量子位· 2025-09-18 10:33
文章核心观点 - 华为通过系统架构和互联技术创新 在AI算力集群层面实现全面超越 预计未来两年保持全球算力领先地位[3][5][30] - 公司公布昇腾系列芯片详细演进路线 坚持"一年一代 算力翻倍"技术迭代节奏[7][8][21] - 推出全球首个通用计算超节点 重塑AI和通用计算基础设施范式[45][48][49] 芯片产品规划 昇腾950系列 - 昇腾950PR:面向推荐和推理场景 采用自研HBM内存方案降低成本 2026年第一季度上市[10][11][12][14] - 昇腾950DT:面向训练场景 互联带宽提升2.5倍 支持自研HBM 2026年第四季度上市[16][17][18][19] - 昇腾960:旗舰训练芯片 规格较950实现翻倍提升 2027年第四季度上市[21][22] - 昇腾970:训练芯片全面升级 FP4/FP8算力翻倍 内存带宽提升1.5倍 2028年第四季度上市[24][25][26] 鲲鹏系列 - 鲲鹏950处理器:支持96核/192线程和192核/384线程两种版本 新增四层安全隔离 2026年第一季度上市[46][52] 超节点系统 Atlas 950超节点 - 支持8,192张昇腾950DT芯片 规模为Atlas 900的20多倍[32] - 关键指标:FP8算力8 EFlops FP4算力16 EFlops 互联带宽16.3 PB/s(超全球互联网总带宽10倍) 内存容量1152 TB[35] - 较英伟达NVL144卡规模达56.8倍 总算力6.7倍 内存容量15倍 互联带宽72倍[37] - 2026年第四季度上市 预计未来两年保持全球算力第一[38] Atlas 960超节点 - 支持15,488张昇腾960/950DT芯片 采用跨柜全光互联[40] - 关键指标全面翻倍:FP8算力30 EFlops FP4算力60 EFlops 内存容量4460 TB 互联带宽34 PB/s[43] - 训练总吞吐4.91百万TPS(较Atlas 900提升17倍) 推理总吞吐19.6百万TPS(提升26.5倍)[42] - 2027年第四季度上市[41] 集群系统 Atlas 950 SuperPlus集群 - 由64个Atlas 950超节点并联 整合52万颗昇腾950T芯片[57] - 总算力达524 EFlops 支持UBOE和RoCE两种组网协议[58] - 2026年第四季度上市[59] Atlas 960 SuperPlus集群 - 规模达百万卡级 FP8总算力2 ZFlops FP4达4 ZFlops[62] - 2027年第四季度上市[62] 通用计算超节点 - 泰山950超节点:全球首个通用计算超节点 最大支持16节点32处理器 内存48TB[48][49] - GaussDB读写架构性能提升2.9倍 可平滑替代大型机小型机传统数据库[50] - 虚拟化环境内存利用率提升20% Spark大数据实时处理时间缩短30%[50] - 2026年第一季度上市[51] 技术创新 - 开创灵衢互联协议 解决万卡超节点长距离高可靠互联难题[54] - 自研HBM方案HiZQ 2.0:内存容量144GB 访问带宽4TB/s 互联带宽2TB/s[27] - 支持Hi-F4数据格式 业界最优4bit精度实现 推理精度优于FP4方案[28]