超节点

搜索文档
科技风起:从昇腾迭代路线图看国产算力发展趋势
长江证券· 2025-09-19 02:42
报告行业投资评级 - 报告未明确给出具体的行业投资评级 [1][2][4][5][6][7][8][9][11][15][16][17][18][19][20][21][22][23][24] 报告核心观点 - 华为在2025年9月18日全联接大会上公布AI芯片、超节点和算力集群路线图 预计2026年第一季度推出昇腾950PR芯片 2026年第四季度推出昇腾950DT芯片 2027年第四季度推出昇腾960芯片 2028年第四季度推出昇腾970芯片 [8][11] - 华为发布最新超节点产品Atlas 950 SuperPoD和Atlas 960 SuperPoD 分别支持8192张和15488张昇腾卡 [11] - 华为发布超节点集群Atlas 950 SuperCluster和Atlas 960 SuperCluster 算力规模分别超过50万卡和达到百万卡 [11] - 超节点正成为AI基础设施建设新常态 通过"超节点+集群"解决方案满足算力需求 [5][11] - 超节点带来互联需求提升、液冷价值量提升、系统解决方案升级和国产先进制程产能需求提升等产业影响 [5][11] 算力芯片迭代升级 - 华为昇腾AI芯片在算力性能、精度支持、向量算力、可编程性、内存容量、内存带宽、互联带宽、PD分离、自研HBM等方向均显著提升 [11] - 芯片生态进一步开放 追赶海外龙头厂商 [11] 超节点发展态势 - 超节点AI服务器算力密度和通信复杂度大幅提升 单节点功耗显著增加 [11] - 华为通过灵衢、UnifiedBus等互联协议消除关键瓶颈 更好支持大模型训练和推理 [11] - 国内半导体产业链加速推进国产技术迭代 先进制程工艺水平和产能规模持续提升 [11] 产业链投资机会 - 国产AI芯片领军企业寒武纪和国产高端CPU、DCU领军企业 [11] - 超节点服务器厂商如烽火通信和神州数码 [11] - 超节点配套链接厂商华丰科技、液冷厂商英维克和PCB厂商 [11] - 华为超节点相关合作伙伴 [11] - 半导体先进制造产业链如晶圆、封测、设备材料等供应商 [11]
2025华为全联接大会解读:昇腾铸芯、超节点织网,华为算力跃升新纪元
东北证券· 2025-09-19 02:41
行业投资评级 - 电子行业评级为"优于大势" [6] 核心观点 - 华为通过昇腾芯片与超节点产品实现系统级创新 在AI算力基础设施领域实现全面突破 为国产算力提供持续替代方案 [1][3] - 昇腾芯片保持"一年一代"迭代节奏 2025-2028年将陆续推出910C/950PR/950DT/960/970系列 算力与带宽性能持续提升 [1][14] - 超节点产品通过灵衢协议和UB-Mesh架构实现高可靠全光互联 覆盖从数据中心到企业级的多样化算力需求 [1][2][24] - 华为在HBM存储器、芯片架构设计和工艺技术方面实现自研突破 逐步补齐与行业龙头的性能差距 [3][15][21] 昇腾芯片产品线 - 昇腾910C已于2025Q1发布 提供800 TFLOPS@FP16算力和3.2TB/s内存带宽 [14][20] - 昇腾950系列将于2026年推出:950PR专注推理和推荐场景 配备1.6TB/s带宽HBM;950DT专注训练和解码场景 配备4TB/s带宽HBM [1][15][16] - 昇腾960计划2027Q4发布 算力、内存容量、内存带宽和互联端口均实现翻倍 达2 PFLOPS@FP8和9.6TB/s带宽 [18][20] - 昇腾970计划2028Q4发布 FP8算力进一步提升至4 PFLOPS 内存带宽达14.4TB/s [19][20] 超节点数据中心产品 - Atlas 900 A3 SuperPoD支持384卡互联 总算力300 PFLOPS 已部署超300套 [27] - Atlas 950 SuperPoD支持8192卡无收敛互联 算力达8 EFLOPS@FP8 互联带宽16.3 PB/s 性能达英伟达NVL144的6.7倍 [30][33] - Atlas 960 SuperPoD计划2027H2发布 支持15488卡互联 算力提升至30 EFLOPS@FP8 互联带宽34 PB/s [33] 超节点集群与企业级产品 - Atlas 950 SuperCluster由64个SuperPoD组成 总算力达524 EFLOPS@FP8(1 ZFLOPS@FP4) 网络时延降低23% 光模块数量减少26% [37] - 企业级风冷服务器Atlas 850支持8颗NPU 算力8 PFLOPS@FP8 后训练吞吐提升3倍 推理时延降至10毫秒 [38][39] - Atlas 860计划2027Q4发布 FP8算力翻倍至16 PFLOPS 显存容量提升至2304GB [39][40] 标卡与鲲鹏产品 - Atlas 350标卡支持850 TFLOPS@FP16算力 128GB HBM3E内存 专为高并发推理和多模态生成任务优化 [41][42] - 鲲鹏950芯片计划2026Q4发布 支持96C/192T规格 TaiShan 950 SuperPoD数据库处理能力提升2.9倍至5.4mn tpmC [44][45] 产业链与合作伙伴 - 昇腾上游产业链涵盖晶圆代工、铜连接(华丰科技)、光连接(华工科技)、电源(泰嘉股份)、PCB(深南电路等)及散热(飞荣达等)领域 [4][46] - 硬件合作伙伴包括科思科技(688788)、华大智造(688114)、广电五舟(831619)、软通动力(301236)等20余家企业 [47][49] - 大模型应用一体机合作伙伴包括蓝凌软件(834906)、恒生电子(600570)、金山办公(688111)、科大讯飞(002230)等30余家企业 [50]
从超节点到集群,华为亮出AI算力全家桶
21世纪经济报道· 2025-09-18 13:17
华为AI算力战略发布 - 公司在全联接大会上公布AI算力全景图 包括4颗昇腾芯片 3个超节点 2款鲲鹏CPU和灵衢互联架构 全面对标英伟达 [1] - 公司强调基于中国可获得的芯片制造工艺打造超节点+集群算力解决方案 以满足持续增长的算力需求 [1][8] - 这是时隔6年后再次集中展示芯片进展 明年大会可能更名为华为计算联接大会 体现对AI算力的重视 [1] 昇腾芯片技术路线 - 昇腾芯片未来三年迭代路线明确:2026年Q1推出Ascend 950系列 2027年Ascend 960 2028年Ascend 970 实现一年一代算力翻倍 [3] - Ascend 950PR面向推理Prefill阶段和推荐场景 新增支持FP8/MXFP578/MXFP4低精度数据格式提升训练效率 [3] - Ascend 950DT更注重推理Decode阶段和训练场景 与950PR形成互补 [3] - 昇腾芯片从2019年昇腾910上市至今已从加速卡演进为完整AI软硬件体系 [4][5] 鲲鹏CPU发展规划 - 鲲鹏950预计2026年Q4推出 鲲鹏960预计2028年Q1推出 [5] - 鲲鹏直接对标英特尔和AMD产品 在超节点中与昇腾芯片形成合力 [5] - 公司围绕鲲鹏和昇腾构建新计算生态 为核心AI算力旗舰产品 [5] 超节点技术突破 - 发布Atlas 950 SuperPoD支持8192张昇腾卡 Atlas 960 SuperPoD支持15488张昇腾卡 在卡规模/总算力/内存容量/互联带宽等关键指标全面领先 [6] - 基于超节点发布全球最强集群Atlas 950 SuperCluster算力超50万卡 Atlas 960 SuperCluster算力达百万卡 [6] - CloudMatrix 384超节点累计部署300多套服务20多家客户 Atlas 950 SuperPoD预计今年Q4上市 Atlas 960 SuperPoD预计2027年Q4上市 [6] 通用计算与互联技术 - 率先将超节点技术引入通用计算领域 发布全球首个通用计算超节点TaiShan 950 SuperPoD 结合GaussDB可取代大型机/小型机及Exadata数据库一体机 [7] - 突破大规模超节点互联技术挑战 开创灵衢(UnifiedBus)互联协议 将开放灵衢2.0技术规范共建开放生态 [7] - 灵衢UB是目前唯二商用的高速互联总线超节点架构产品 可与英伟达NVLink直接竞争 [7] 算力发展战略 - 公司通过架构性创新开创自主可持续计算产业发展道路 强调系统算力而非单处理器算力 [8] - 在系统工程层面通过超节点系统有效调度 昇�系统能效可比肩英伟达 [9] - 中国AI市场多厂商竞争格局形成 包括华为昇腾/阿里平头哥/百度昆仑/寒武纪等均在追赶英伟达 [5]
华为披露芯片路线图,详情披露
半导体芯闻· 2025-09-18 10:40
华为昇腾芯片技术演进 - 昇腾芯片持续演进 为中国及全球AI算力提供基础 未来3年规划三个系列芯片 包括Ascend 950/960/970系列 [2][3] - Ascend 950系列即将推出 包含两颗芯片:950PR面向推理Prefill和推荐场景 950DT面向推理Decode和训练场景 [3][4] - 相比前代Ascend 910C Ascend 950实现根本性提升:新增支持FP8/MXFP8/MXFP4等低精度格式 FP8算力达1 PFLOPS FP4算力达2 PFLOPS 互联带宽提升2.5倍至2TB/s [3][4][5] - 采用自研HBM技术:950PR采用HiBL 1.0 HBM 降低成本 950DT采用HiZQ 2.0 HBM 内存容量达144GB 带宽达4TB/s [4][5] - Ascend 960规划于2027Q4推出 各项规格相比950翻倍 FP8算力达2 PFLOPS FP4算力达4 PFLOPS 支持HiF4格式 [6][7] - Ascend 970规划于2028Q4推出 相比960 FP8算力翻倍至4 PFLOPS FP4算力翻倍至8 PFLOPS 互联带宽翻倍至4TB/s 内存带宽提升1.5倍 [7] 超节点产品布局 - Atlas 900超节点已部署300多套 满配384颗Ascend 910C芯片 算力达300 PFLOPS 服务20多个客户 [8] - 新发布Atlas 950超节点 基于Ascend 950DT 支持8192张卡 是Atlas 900规模的20多倍 FP8算力达8 EFLOPS FP4算力达16 EFLOPS 互联带宽达16PB/s 超全球互联网峰值带宽10倍 2026Q4上市 [9][10] - 相比英伟达NVL144 Atlas 950卡规模是其56.8倍 总算力是其6.7倍 内存容量达1152TB是其15倍 互联带宽达16.3PB/s是其62倍 [10] - Atlas 950超节点训练性能提升17倍达4.91M TPS 推理性能提升26.5倍达19.6M TPS [10][11] - Atlas 960超节点规划于2027Q4 基于Ascend 960 支持15488卡 FP8总算力达30 EFLOPS FP4总算力达60 EFLOPS 内存容量达4460TB 互联带宽达34PB/s 训练和推理性能相比950提升3倍和4倍以上 [11] 集群解决方案 - Atlas 950 SuperCluster集群由64个Atlas 950超节点组成 集成52万多片昇腾950DT卡 FP8总算力达524 EFLOPS 2026Q4上市 [19] - 相比xAI Colossus集群 华为集群规模是其2.5倍 算力是其1.3倍 [20] - Atlas 960 SuperCluster规划于2027Q4 规模达百万卡级 FP8总算力达2 ZFLOPS FP4总算力达4 ZFLOPS [20] - 集群支持UBoE和RoCE协议 UBoE相比RoCE静态时延更低 可靠性更高 节省交换机和光模块数量 [20] 通用计算超节点 - 鲲鹏处理器围绕超节点方向演进 2026Q1推出Kunpeng 950处理器 两个版本:96核/192线程和192核/384线程 支持通用计算超节点 新增四层隔离安全特性 [12] - 发布TaiShan 950通用计算超节点 基于Kunpeng 950 最大支持16节点32个处理器 内存48TB 支持内存/SSD/DPU池化 2026Q1上市 [14] - TaiShan 950助力金融系统替代大型机/小型机 结合GaussDB多写架构无需分布式改造 性能提升2.9倍 [14][15] - 在虚拟化环境内存利用率提升20% Spark大数据场景实时处理时间缩短30% [15] - 支持构建混合超节点 结合TaiShan 950和Atlas 950 为生成式推荐系统提供PB级共享内存池和超低时延推理能力 [15] 互联技术创新 - 华为开创超节点互联协议"灵衢"(UB) 灵衢1.0已用于Atlas 900超节点 灵衢2.0用于Atlas 950超节点 将开放给产业界共建生态 [17][18][19] - 解决长距离高可靠互联问题 光互联可靠性提升100倍 距离超200米 [16][17] - 解决大带宽低时延问题 实现TB级带宽和2.1微秒时延 [16][17] - 万卡超节点架构具备六大特征:总线级互联、平等协同、全量池化、协议归一、大规模组网、高可用性 [17]
华为AI芯片计划全盘托出!全球最强超节点+超级集群,未来2年全面领先
量子位· 2025-09-18 10:33
文章核心观点 - 华为通过系统架构和互联技术创新 在AI算力集群层面实现全面超越 预计未来两年保持全球算力领先地位[3][5][30] - 公司公布昇腾系列芯片详细演进路线 坚持"一年一代 算力翻倍"技术迭代节奏[7][8][21] - 推出全球首个通用计算超节点 重塑AI和通用计算基础设施范式[45][48][49] 芯片产品规划 昇腾950系列 - 昇腾950PR:面向推荐和推理场景 采用自研HBM内存方案降低成本 2026年第一季度上市[10][11][12][14] - 昇腾950DT:面向训练场景 互联带宽提升2.5倍 支持自研HBM 2026年第四季度上市[16][17][18][19] - 昇腾960:旗舰训练芯片 规格较950实现翻倍提升 2027年第四季度上市[21][22] - 昇腾970:训练芯片全面升级 FP4/FP8算力翻倍 内存带宽提升1.5倍 2028年第四季度上市[24][25][26] 鲲鹏系列 - 鲲鹏950处理器:支持96核/192线程和192核/384线程两种版本 新增四层安全隔离 2026年第一季度上市[46][52] 超节点系统 Atlas 950超节点 - 支持8,192张昇腾950DT芯片 规模为Atlas 900的20多倍[32] - 关键指标:FP8算力8 EFlops FP4算力16 EFlops 互联带宽16.3 PB/s(超全球互联网总带宽10倍) 内存容量1152 TB[35] - 较英伟达NVL144卡规模达56.8倍 总算力6.7倍 内存容量15倍 互联带宽72倍[37] - 2026年第四季度上市 预计未来两年保持全球算力第一[38] Atlas 960超节点 - 支持15,488张昇腾960/950DT芯片 采用跨柜全光互联[40] - 关键指标全面翻倍:FP8算力30 EFlops FP4算力60 EFlops 内存容量4460 TB 互联带宽34 PB/s[43] - 训练总吞吐4.91百万TPS(较Atlas 900提升17倍) 推理总吞吐19.6百万TPS(提升26.5倍)[42] - 2027年第四季度上市[41] 集群系统 Atlas 950 SuperPlus集群 - 由64个Atlas 950超节点并联 整合52万颗昇腾950T芯片[57] - 总算力达524 EFlops 支持UBOE和RoCE两种组网协议[58] - 2026年第四季度上市[59] Atlas 960 SuperPlus集群 - 规模达百万卡级 FP8总算力2 ZFlops FP4达4 ZFlops[62] - 2027年第四季度上市[62] 通用计算超节点 - 泰山950超节点:全球首个通用计算超节点 最大支持16节点32处理器 内存48TB[48][49] - GaussDB读写架构性能提升2.9倍 可平滑替代大型机小型机传统数据库[50] - 虚拟化环境内存利用率提升20% Spark大数据实时处理时间缩短30%[50] - 2026年第一季度上市[51] 技术创新 - 开创灵衢互联协议 解决万卡超节点长距离高可靠互联难题[54] - 自研HBM方案HiZQ 2.0:内存容量144GB 访问带宽4TB/s 互联带宽2TB/s[27] - 支持Hi-F4数据格式 业界最优4bit精度实现 推理精度优于FP4方案[28]
徐直军:华为对为人工智能发展提供充裕算力充满信心
证券时报· 2025-09-18 10:26
核心观点 - 华为发布全球最强算力超节点及集群 并公布昇腾芯片未来规划 彰显公司在AI算力基础设施领域的技术领先地位和对可持续算力供应的信心 [1][2][6] 产品发布 - 推出Atlas 950 SuperPoD超节点 支持8192张昇腾卡 [1] - 推出Atlas 960 SuperPoD超节点 支持15488张昇腾卡 [1] - 发布Atlas 950 SuperCluster集群 算力规模超50万卡 [1] - 发布Atlas 960 SuperCluster集群 算力规模达百万卡 [1] - 推出全球首个通用计算超节点TaiShan 950 SuperPoD 可取代大型机和小型机 [2] - Atlas 900超节点保持全球算力最大 满配支持384卡 最大算力300 PFLOPS [2] 技术突破 - 通过系统性创新实现光互联可靠性提升100倍 互联距离超过200米 [4][5] - 突破多端口聚合与高密封装技术 实现TB级超大带宽和2.1微秒超低时延 [5] - 开创超节点架构及新型互联协议 支持万卡级规模像单台计算机一样工作 [5] - 解决长距离高可靠互联挑战 在协议各层引入高可靠机制 [4][5] - 解决大带宽低时延挑战 将跨柜时延从3微秒降至2.1微秒 提升24% [4][5] 芯片规划 - 昇腾芯片将持续演进 未来三年规划三个系列:Ascend 950/960/970 [6] - Ascend 950系列包含两颗芯片:950PR和950DT [6] - Ascend 950PR芯片将于2026年第一季度推出 采用自研HBM [6] 战略意义 - 超节点技术重新定义AI基础设施范式 成为主导性产品形态 [3] - 混合超节点为下一代生成式推荐系统提供全新架构选择 [3] - 昇腾芯片为AI算力战略基础 自2018年以来持续迭代升级 [2][6] - 万卡超节点架构实现"一台计算机"的逻辑统一性 [5]
打造全球最强算力 华为徐直军时隔六年再谈芯片进展
第一财经· 2025-09-18 08:51
华为还在现场发布了Atlas950 SuperPoD和Atlas 960 SuperPoD超节点,分别支持8192及15488张昇腾卡, 从卡规模、总算力、内存容量、互联带宽等关键指标上看,处于全球领先位置。此外,华为还同时发布 了超节点集群,分别是Atlas950 SuperCluster和Atlas960 SuperCluster,算力规模分别超过50万卡和达到 百万卡。 此外,他表示,超节点成为AI基础设施建设新常态,目前Cloud Matrix 384超节点累计部署300套以上。 徐直军指出:"算力过去是,未来也将继续是人工智能的关键,更是中国人工智能的关键。"此外,他再 次强调:"基于中国可获得的芯片制造工艺,华为努力打造'超节点+集群'算力解决方案,来满足持续增 长的算力需求。" 徐直军认为,超节点在物理上由多台机器组成,但逻辑上以一台机器学习、思考、推理。 华为在全联接大会2025上罕见公布了多款自研芯片的研发进展。 9月18日,华为副董事长、轮值董事长徐直军在演讲中表示,未来三年,华为已经规划了昇腾多款芯 片,包括950PR,950DT以及昇腾960和970。其中950PR2026年第一季度对 ...
华为官宣昇腾芯片迭代时间表
财联社· 2025-09-18 08:49
以下文章来源于科创板日报 ,作者黄心怡 此外,华为还规划后续推出Atlas 960 SuperPoD ,预计将支持15488张昇腾卡,算力达30 EFLOPS FP8 / 60 EFLOPS FP4,计划2027年四季度 上市。 基于超节点,华为同时发布了 全球最强超节点集群,分别是Atlas 950 SuperCluster和 Atlas 960 SuperCluster,算力规模分别超过50万卡和达到 百万卡。 除了昇腾芯片以外,华为今日还公布了通用计算领域鲲鹏芯片路线图, 预计鲲鹏 950 芯片 2026 年 Q4 推出,鲲鹏 960 芯片 2028 年 Q1 推出 。同时, 华为推出了全球首个通算超节点TaiShan950 SuperPoD,将于2026年第一季度上市。 结合GaussDB分布式数据库,能够取代各种应用场 景的大型机和小型机以及Exadata数据库一体机,将成为各类大型机、小型机的终结者。 科创板日报 . 科创板第一媒体平台,聚焦科创板及新兴产业发展,专业、权威。 "算力,过去是,未来也将继续是,人工智能的关键,更是中国人工智能的关键。"华为轮值董事长徐直军在华为全联接大会2025上表 ...
华为徐直军时隔六年再谈芯片进展
第一财经资讯· 2025-09-18 05:56
自研芯片规划 - 公司规划未来三年推出多款昇腾芯片包括950PR 950DT以及昇腾960和970 其中950PR芯片将于2026年第一季度推出并采用自研HBM技术 [2] 算力基础设施布局 - 超节点成为AI基础设施建设新常态 Cloud Matrix 384超节点累计部署300套以上 [4] - 公司发布Atlas950 SuperPoD和Atlas960 SuperPoD超节点 分别支持8192张及15488张昇腾卡 关键指标全球领先 [7] - 公司发布超节点集群Atlas950 SuperCluster和Atlas960 SuperCluster 算力规模分别超过50万卡和达到百万卡 [7] - 公司推出全球首个通用计算超节点TaiShan 950SuperPoD 结合GaussDB分布式数据库可取代大型机和小型机 [8] 技术突破与开放策略 - 公司突破大规模超节点互联技术挑战 推出面向超节点的互联协议灵衢(UnifiedBus)并计划开放灵衢2.0技术规范 [8] - 尽管单颗芯片算力受制裁影响存在差距 但通过联接技术突破实现万卡级超节点构建全球最强算力 [8] 战略定位 - 算力是人工智能及中国人工智能发展的关键要素 [4] - 公司基于中国可获得的芯片制造工艺打造超节点+集群算力解决方案以满足持续增长的算力需求 [4] - 超节点在物理上由多台机器组成但逻辑上以单台机器运作 [5] - 公司对为人工智能长期快速发展提供可持续充裕算力充满信心 [8] - 公司愿与产业界共同构筑支撑中国及全球AI算力需求的坚实底座 [8]
华为徐直军时隔六年再谈芯片进展
第一财经· 2025-09-18 05:50
芯片研发进展 - 未来三年规划多款昇腾芯片包括950PR、950DT、960和970 其中950PR将于2026年第一季度推出并采用自研HBM技术 [3] 算力基础设施 - 超节点成为AI基础设施建设新常态 Cloud Matrix 384超节点累计部署超过300套 [5] - 发布Atlas950 SuperPoD和Atlas960 SuperPoD超节点 分别支持8192张和15488张昇腾卡 关键指标全球领先 [7] - 发布超节点集群Atlas950 SuperCluster和Atlas960 SuperCluster 算力规模分别超过50万卡和达到百万卡级 [7] - 推出全球首个通用计算超节点TaiShan 950SuperPoD 结合GaussDB可取代大型机和小型机 [7] 互联技术突破 - 突破大规模超节点互联技术挑战 推出面向超节点的互联协议灵衢(UnifiedBus) 未来将开放灵衢2.0技术规范 [7] - 通过联接技术突破实现万卡级超节点 弥补单芯片算力差距 构建全球最强算力系统 [8] 战略定位 - 基于中国可获得的芯片制造工艺打造超节点+集群算力解决方案 满足持续增长的算力需求 [5] - 致力于为人工智能长期快速发展提供可持续且充裕算力 构筑支撑中国及全球AI算力需求的坚实底座 [7][8]