Workflow
华为970系列芯片
icon
搜索文档
华为算力新品专题解读
2025-09-22 01:00
公司及行业 * 华为及其AI芯片与算力集群产品[1][2][3][4][5][6][7][8][9][10][11][12][13][14][15][16][17][18][19][20][21][22][23][24][25][26][27] 核心产品与技术突破 * 华为生成系列AI芯片包括920C、950、960和970等多个型号[2] * 950系列芯片支持FP8精度计算 减少10%-15%的转换损失[1][2] * 950采用双带设计 占地面积减少30% 综合性能优于910B[1][4] * 960型号在950基础上增加带数量至四个 提升整体算力[1][5][8] * 970型号回归660平方毫米占地面积 制程升级至N+3 性能预计提升30%[1][5][8][12] * 950算力约为1P 通过减少单带面积提升良率和产能[2] * 华为计划2026年推出两款自研HBM产品 分别对标HBM2E和HBM3 其中对标HBM2E的产品预计在第一季度末发布[1][7][9] * 华为拥有全栈能力 在硬件和协议层面具备深度优化能力[13][14] 集群规模与互联技术 * 华为构建8000卡和15000卡超大集群 优化算力规模[1][6][10] * 互联带宽提升至2T 通过增加IO数量和设备升级实现[3][4] * 交换机配置从256T升级至512T 光模块迭代至800G[6][15] * 采用UB Mesh等协议支持规模扩展至15000张卡以上[10][26] * 协议层面包含零区协议站、总线级互联能力及统一编码模型等底层技术[26] * 新协议在超级计算领域至关重要 用于管理PB级数据传输和纳秒级延迟[27] 产品定价与出货预期 * 950系列对外定价约10万元 客户价预计8万元左右[3][20] * 960系列定价约17-18万元 成交价约15万元[3][21] * 970系列定价较高 预计24-25万元[3][21] * 2026年预计920C出货量约60万颗 950出货量约40-50万颗 总出货量预计100-110万颗[3][24] 生态建设与市场竞争 * 华为通过扩大集群规模弥补单卡算力及生态短板[11][22] * 国内开发者数量仅10万级 与NV全球百万级开发者存在量级差距[23] * 国产生态难以获得真实反馈 训练场景中模板库、算法库适配进展缓慢[23] * 华为通过内部使用和开源逐步补齐模板、算子库、供应链及编译器能力差异 预计需要三年或更长时间[23] * 国内以华为为主不断向大机、大单节点发展 而NV依靠全球顶尖工艺通过单卡能力实现性能表现[22] * 华为受限于制程和关键工艺 目前停留在N+2阶段 2027年才会有N+3[22] CPU产品规划 * 华为将推出鲲鹏950和960系列CPU[3][25] * 鲲鹏950最高配置可达96核、192T以及192核、384T[25] * 鲲鹏950支持通算的三个点 可以与超级计算领域融合和绑定[25] * 例如配备8000卡的鲲鹏950CPU可以以3:1或4:1的比例搭配GPU和CPU使用[25] 技术挑战与优化方向 * 大规模集群下算力损失及平均宕机周期较短约一周或八九天[10] * 通过提升单卡互联算力及配备光模块、交换芯片等技术优化表现[10][15] * 硬件方面提升光模块和交换机配置 如传统384模块升级为400个光模块[15] * 软件方面包括虚拟化技术、内存搁浅动态调整以及热迁移效率优化[26] * 需要应对资源配置失衡及数据交换效率制约等问题[26]