超节点+集群

搜索文档
“超节点+集群”:华为闯出AI算力自主创新之路
科技日报· 2025-09-28 23:47
算力是数字经济时代的发动机。从大模型掀起新一轮人工智能浪潮以来,算力不再只是产业背后的技术 细节,而一跃成为社会数智化转型中不可或缺的核心资源。 截至今年6月底,我国在用算力中心机架总规模达到1085万标准机架,智能算力规模达到788EFlops (EFlops指每秒百亿亿次浮点运算),位居全球前列。然而,随着AI快速迭代,算力不足的隐忧仍如影 随形。 "算力过去是,未来也将继续是人工智能的关键,更是中国人工智能的关键。"在日前举行的华为全联接 大会2025上,华为副董事长、轮值董事长徐直军说,要迈向真正的AGI(通用人工智能),走向物理 AI、世界模型,需要海量算力作支撑。 "基于中国可获得的芯片制造工艺,华为努力打造'超节点+集群'算力解决方案,来满足持续增长的算力 需求。"徐直军说,这不仅是华为自身的发展目标,更是对产业、对国家的长期承诺。 差异化路径突破外部限制 面对持续攀升的算力需求以及芯片制造工艺的外部限制,华为选择了一条差异化路径:以"超节点+集 群"构建全新的算力供给体系。 "我们换条路走。"徐直军直言,"只有依靠超节点和集群,才能规避中国在芯片制造工艺上受到的限 制,为中国AI算力提供源源不 ...
昇腾AI:引领超节点+集群时代:AI算力卖水人系列(8)
国海证券· 2025-09-28 13:35
**报告行业投资评级** 推荐(维持) [1] **报告核心观点** 华为昇腾AI凭借"超节点+集群"架构引领AI算力发展,在AI国产化趋势下有望持续受益。其全栈软硬件平台可对标英伟达,通过每年一代的芯片迭代、开源软件生态及自主可控的产业链优势,实现算力性能持续提升和生态扩张。[5][7][8] **分章节总结** 昇腾芯片与技术架构 - 昇腾处理器基于达芬奇架构,是全球首个覆盖全场景的AI芯片,具备高算力、高能效特性[15] - 昇腾910C集群CloudMatrix 384提供300PFLOPS BF16算力,性能达英伟达GB200 NVL72的1.7倍,内存带宽为2.1倍[25] - 截至2025年9月,Atlas 900 A3 SuperPoD超节点累计部署300多套,服务20多个行业客户[24] - 2026年将发布昇腾950/Atlas 950 SuperPoD(8192卡,8EFLOPS FP8算力),2027年推出昇腾960(15488卡,16EFLOPS FP4算力),保持每年一代、算力翻倍节奏[5][32][36] - 推出业界首款通算超节点Taishan 950(2026Q1)和企业级风冷AI超节点Atlas 850(2026Q4)[5][55][59] 软件生态与开源体系 - 2025年8月CANN全面开源,对标英伟达CUDA核心软件层,支持200+API,算子开发效率提升30%[5][94][95] - 昇思MindSpore 2023年全球市占率11%,支持DeepSeek等大模型训练,万亿参数模型性能提升20%[16][98][102] - MindStudio工具链实现训练性能提升340%,推理模型分钟级迁移[104][107] - 推理引擎MindIE支持吞吐提升50%,时延降低50%[108][110] 产业链与需求分析 - AI芯片占服务器价值量约70%,光模块、液冷、电源等零部件成长性较强[6] - 2024年中国加速芯片市场规模超270万张,其中国产品牌出货82万张,市占率30%[7][140] - 英伟达H20芯片在华受阻,国产替代空间打开[7][146] - 全球AI资本支出未来五年预计达3-4万亿美元,主权AI领域投资超1万亿美元[7] - 2025Q2阿里云收入334亿元(同比+26%),腾讯资本开支191亿元(同比+119%)[148][151] - 海外CSP资本开支高增:微软Q2支出242亿美元(同比+27%),亚马逊322亿美元(同比+83%)[152][155] 晶圆制造与自主可控 - 中美关税摩擦推动自主可控进程,2027年央企信息化系统需完成信创替代[130][131] - 台积电2025年推进2nm工艺,中芯国际位居全球晶圆代工第四[117][123] - 半导体产业链涵盖设计、制造、封测三环节,中国大陆企业在EDA、设备、材料等领域持续突破[116] 生态合作与智算中心 - 昇腾联合宝德、华鲲振宇等整机伙伴,以及凌华科技等IHV伙伴构建生态[85] - 已在北京、武汉、西安等12个城市建设昇腾智算中心,鹏城云脑II算力达1000P[87][88] - 华为灵衢互联协议实现组件资源池化,2025年9月开放灵衢2.0[5][76] *注:总结严格遵循要求,未包含风险提示、免责声明、评级规则及其他无关内容,所有数据均引用自报告原文*
徐直军:华为整个计算战略在五个字上
选股宝· 2025-09-21 02:59
华为AI算力战略与产品规划 - 公司核心战略为"超节点+集群" 旨在规避芯片制造工艺限制 为国内AI算力提供持续供给 [2][6] - 已部署CloudMatrix 384超节点 含384张昇腾算力卡 是目前全球规模最大且算力最高的商用超节点 [4][10] - Atlas 950 SuperPoD(8192卡)和Atlas 960 SuperPoD(15488卡)将分别于2026年Q4和2027年Q4上市 [2][8][9] 技术架构创新 - 打破传统以CPU为中心的冯诺依曼架构 创建自有标准的"平等互联架构" 通过高速总线互联技术实现跨机柜扩展 [5] - 采用光通信技术 在昇腾384超节点中使用3168根光纤和6912个400G光模块 保障高速长距离传输 [5] - 灵衢互联协议技术指标超过950/960超节点设计要求 可支持算力翻倍 [10] 产品路线图 - 昇腾AI芯片系列:昇腾950PR/950DT于2026年Q1上市 昇腾960于2026年Q4上市 昇腾970于2027年Q4上市 实现一年一代算力翻倍 [8] - 鲲鹏计算芯片:鲲鹏950于2026年Q1上市 鲲鹏960于2028年Q1上市 [8] - 通算超节点支持16节点/48TB内存 将于2026年Q1上市 [8] 竞争优势对比 - Atlas 950超节点相比英伟达NVL144(2025年下半年上市):算力卡规模达56.8倍 总算力达6.7倍 内存容量达15倍(1152TB) 互联带宽达62倍(16.3PB/s) [9] - 即使对比英伟达2027年NVL576 Atlas 950在各项指标仍保持领先 [2][9] - 单颗芯片算力较英伟达存在差距 但通过超节点架构实现并行计算优势 [10] 生态建设策略 - 坚持自研MindSpore生态体系 不兼容CUDA生态 确保技术自主可控 [12] - 通过开源开放软件生态促进硬件销售 吸引开发者繁荣生态 [11] - 定位算力基础设施提供商 不与大模型企业直接竞争 聚焦硬件系统整合能力 [12] 历史背景与突破 - 2019年昇腾910规格不低于同期英伟达产品 但受制裁后被迫转换创新路径 [3][4] - 海思曾与苹果同为台积电每代工艺首发战略伙伴 芯片品类覆盖最全 [3] - 当前技术突破被形容为"被逼出来的创新" 通过系统工程创新实现规模算力领先 [2][4][5] 产业定位与展望 - 公司认为AI产业仍处于2G阶段 未来十年将经历快速迭代 最终比拼综合实力 [13] - 承诺满足国内所有AI算力需求 "要多少算力给多少算力" [6] - 光器件/光模块/连接芯片等核心部件全部自研自造 保障供应链安全 [10]
对话徐直军:华为整个计算战略在五个字上
第一财经· 2025-09-21 01:26
华为AI算力战略与产品规划 - 公司核心战略为"超节点+集群" 旨在规避芯片制造工艺限制 为国内AI算力提供持续供给 [2] - 通过超节点系统工程创新实现规模算力领先 打破传统以CPU为中心的冯诺依曼架构 建立自有标准"平等互联架构" [4][5] - 采用跨机架纵向扩展方案 引入光通信技术 在昇腾384超节点中使用3168根光纤和6912个400G光模块 [5] 产品技术规格与时间表 - Atlas 950 SuperPoD超节点算力规模8192卡 2026年第四季度上市 Atlas 960 SuperPoD算力规模15488卡 2027年第四季度上市 [2][8][9] - 昇腾芯片系列规划:昇腾950PR/950DT于2026年Q1上市 昇腾960于2027年Q4上市 昇腾970于2028年Q4上市 实现一年一代算力翻倍 [8] - 鲲鹏通算芯片规划:鲲鹏950于2026年Q1上市 鲲鹏960于2028年Q1上市 同时推出全球首个通算超节点 支持最大16节点/48TB内存 [8] 技术对比与竞争优势 - Atlas 950超节点相比英伟达NVL144:算力卡规模为其56.8倍 总算力为其6.7倍 内存容量为其15倍达1152TB 互联带宽为其62倍达16.3PB/s [9] - 相比英伟达计划2027年上市的NVL576 Atlas 950超节点在各方面保持领先 [2][9] - 单颗芯片算力较英伟达存在差距 但通过超节点架构实现并行计算优势 [10] 生态建设与开源策略 - 不兼容CUDA生态 自主研发MindSpore框架 从达芬奇核到昇腾芯片均不依赖西方生态和供应链 [12] - 通过开源开放策略吸引开发者 促进硬件销售 软件生态建设是痛苦但必要的决策 [11] - 定位为算力基础设施提供商 不与大模型企业直接竞争 旨在形成健康合作关系 [12] 研发背景与技术突破 - 2019年发布的昇腾910规格不低于英伟达 但受制裁后被迫在超节点架构上创新突破 [3][4] - CloudMatrix 384超节点是目前中国规模最大商用超节点 单体规模全球最大 有效算力全球最高 [4] - 依赖三大核心技术:自主设计的光模块、连接芯片以及操作系统/数据库/编译器全套软件生态 [10] 市场定位与行业展望 - 公司承诺满足国内所有AI算力需求 "要多少算力给多少算力" [6] - 认为AI行业仍处于2G阶段 未来十年将出现颠覆性变化 最终比拼综合实力 [13] - 当前384超节点技术已被多家厂商尝试拆解 但实现难度较大 [6]
对话徐直军:华为整个计算战略在五个字上
是说芯语· 2025-09-20 07:13
文章核心观点 - 华为在AI算力领域通过"超节点+集群"战略实现技术突破 旨在为国内提供可持续且充裕的算力供给 [2][3][4] - 公司公布芯片及超节点技术路线图 宣称其Atlas超节点算力规模及性能指标全面超越英伟达同类产品 [12][13] - 通过自研光互联技术及平等互联架构打破传统计算范式 规避芯片制造工艺限制 [8][9][16] 芯片技术规划 - 昇腾AI芯片系列规划三代产品:昇腾950PR/950DT于2026Q1上市 昇腾960于2026Q4上市 昇腾970于2027Q4上市 实现一年一代算力翻倍 [12] - 鲲鹏计算芯片规划鲲鹏950于2026Q1上市 鲲鹏960于2028Q1上市 [12] - 推出全球首个通算超节点 支持最大16节点/48TB内存 支持内存/SSD/DPU池化 2026Q1上市 [12] 超节点技术突破 - CloudMatrix 384超节点已商用 搭载384张昇腾卡 使用3168根光纤和6912个400G光模块 为当前全球最大规模商用超节点 [8][9] - Atlas 950 SuperPoD超节点将于2026Q4上市 算力规模8192卡 相比英伟达NVL144卡规模达56.8倍 总算力达6.7倍 内存容量1152TB达15倍 互联带宽16.3PB/s达62倍 [13] - Atlas 960 SuperPoD超节点将于2027Q4上市 算力规模15488卡 超越英伟达计划2027年上市的NVL576 [3][13] 技术架构创新 - 打破以CPU为中心的冯诺依曼架构 创建自有标准"平等互联架构" 通过高速总线互联技术实现跨机柜扩展 [8][9] - 采用光通信技术实现超大规模集群 光模块及连接芯片全部自研自造 [16] - 灵衢互联协议技术指标超过950/960超节点设计要求 可支持四倍算力规模的昇腾卡接入 [15] 生态战略布局 - 坚持自研MindSpore生态体系 不兼容CUDA生态 确保技术栈完全独立于西方供应链 [18] - 通过开源开放软件工具链促进硬件销售 聚焦算力基础设施定位 与大模型企业形成合作关系 [17][18] - 认为AI行业仍处2G初级阶段 未来十年将出现颠覆性变化 最终比拼企业综合实力 [19]
对话华为轮值董事长徐直军:“整个计算战略在五个字上”
第一财经· 2025-09-19 13:42
公司战略与定位 - 公司核心战略为超节点+集群 旨在规避芯片制造工艺限制 为中国AI算力提供持续供给 [1][2] - 公司定位为算力基础设施提供商 而非直接变现大模型 聚焦与全球大模型企业合作推动AI产业发展 [21] 技术产品规划 - AI芯片昇腾规划三年三代产品 昇腾950PR/950DT于2026Q1上市 昇腾960于2026Q4上市 昇腾970于2027Q4上市 实现一年一代算力翻倍 [15] - 计算芯片鲲鹏950于2026Q1上市 鲲鹏960于2028Q1上市 [15] - 超节点技术路线:CloudMatrix 384已商用 Atlas 950 SuperPoD(8192卡)于2026Q4上市 Atlas 960 SuperPoD(15488卡)于2027Q4上市 [2][15][16] 技术性能指标 - Atlas 950超节点对比英伟达NVL144:算力卡规模为其56.8倍 总算力为其6.7倍 内存容量1152TB为其15倍 互联带宽16.3PB/s为其62倍 [16] - Atlas 960超节点规模达15488卡 且架构具备极强可扩展性 [16][18] - 当前CloudMatrix 384超节点使用3168根光纤和6912个400G光模块 为全球算力最强超节点之一 [11][18] 技术创新突破 - 打破传统冯诺依曼架构 建立平等互联架构 通过高速总线互联技术实现跨机柜扩展 [10] - 采用光通信技术实现跨机架纵向扩展 光模块与光器件自主设计制造 [11][19] - 灵衢互联协议技术指标超过设计要求 可支持算力翻番 [18] 生态建设策略 - 软件层面实行开源开放策略 旨在吸引开发者促进硬件销售 [20] - 坚持自主研发MindSpore生态 不兼容CUDA生态以确保技术自主可控 [21] - 通过用户实际使用反馈持续优化工具链 承认当前生态与英伟达存在差距 [20] 行业竞争态势 - 公司被英伟达视为最强劲对手 但在单芯片算力和功耗方面仍存在差距 [18] - 通过超节点系统创新实现规模算力领先 384超节点规模超越英伟达256产品规划 [10][18] - 2019年昇腾910规格不低于英伟达同期产品 曾与苹果同为台积电战略伙伴 [9] 产能与供应保障 - 公司明确表示当前产品能满足国内算力需求 无需担心供应问题 [1][12] - 承诺国内AI要多少算力供多少算力 要什么算力供什么算力 [12] 技术发展背景 - 超节点+集群模式是在美国制裁下被逼出来的创新路径 [3][10] - 海思曾为全球芯片品类最全企业 但因工艺受限转向系统级创新 [9] 行业发展趋势 - AI行业仍处于相当于移动通信2G的初级阶段 未来十年将出现颠覆性变化 [22] - 最终竞争将取决于企业综合实力 技术路径存在极大不确定性 [22]
华为徐直军谈芯片三年规划,努力打造“超节点+集群”解决方案
第一财经· 2025-09-18 04:45
芯片产品规划 - 公司规划未来三年推出多款昇腾芯片包括950PR 950DT 960和970 其中950PR芯片将于2026年第一季度推出并采用自研HBM技术 [1] - 公司发布Atlas950 SuperPoD和Atlas960 SuperPoD超节点 分别支持8192张和15488张昇腾卡 在卡规模总算力内存容量及互联带宽等关键指标处于全球领先位置 [5] - 公司发布超节点集群Atlas950 SuperCluster和Atlas960 SuperCluster 算力规模分别超过50万卡和达到百万卡级别 [5] 技术突破与创新 - 公司突破大规模超节点互联技术挑战 推出面向超节点的互联协议灵衢(UnifiedBus)并计划未来开放灵衢2.0技术规范 [6] - 公司率先将超节点技术引入通用计算领域 发布全球首个通用计算超节点TaiShan 950SuperPoD 结合GaussDB分布式数据库可取代大型机小型机及Exadata数据库一体机 [6] - 超节点在物理上由多台机器组成 但逻辑上以单台机器学习思考推理 目前Cloud Matrix 384超节点累计部署300套以上 [3] 战略定位与行业影响 - 公司基于中国可获得的芯片制造工艺打造超节点+集群算力解决方案 以满足持续增长的算力需求 [3] - 公司通过联接技术突破实现万卡级超节点 弥补单颗芯片算力差距 构建全球最强算力基础设施 [6] - 算力被定义为人工智能及中国人工智能发展的关键要素 公司对提供可持续且充裕的AI算力充满信心 [1][3][6]