Atlas 960超节点 - 财报，业绩电话会，研报，新闻

Atlas 960超节点

搜索文档

半导体行业观察· 2025-09-19 01:29

昇腾AI芯片路线图 - 重申四大战略方向：坚持昇腾硬件变现、CANN编译器及虚拟指令集接口开放（其他软件全开源）、Mind系列应用使能套件及工具链全面开源、openPangu基础大模型全面开源，多项开源计划于2025年12月31日前完成 [2] - 未来三年规划三个芯片系列：即将推出的Ascend 950系列（含950PR和950DT两颗芯片）、以及规划中的Ascend 960和Ascend 970系列 [3] - Ascend 950系列实现根本性提升：新增支持FP8/MXFP8/MXFP4/HiF8等低精度格式，算力达1P/2P FLOPS；大幅提升向量算力；互联带宽相比910C提升2.5倍至2TB/s；自研两种HBM（HiBL 1.0和HiZQ 2.0）与Die合封，分别面向Prefill/推荐场景和Decode/训练场景 [3][4][5] - Ascend 950PR芯片采用自研低成本HBM（HiBL 1.0），面向推理Prefill阶段和推荐业务，计划2026年一季度推出 [5] - Ascend 950DT芯片采用自研HiZQ 2.0 HBM，内存容量144GB，访问带宽4TB/s，互联带宽2TB/s，面向推理Decode和训练场景，计划2026年四季度推出 [6] - Ascend 960芯片各项规格相比950翻倍，支持自研HiF4数据格式，计划2027年四季度推出 [6] - Ascend 970芯片规划FP4/FP8算力及互联带宽全面翻倍，内存访问带宽至少增加1.5倍，计划2028年四季度推出，实现几乎一年一代算力翻倍的演进速度 [7][12] Atlas超节点产品发布 - Atlas 900超节点满配384颗Ascend 910C芯片，最大算力300 PFLOPS，截至2025年已部署超300套，服务20多个客户 [8] - 发布基于Ascend 950DT的Atlas 950超节点：支持8192张昇腾卡，由160个机柜组成，占地面积约1000平方米，FP8算力8E FLOPS，FP4算力16E FLOPS，互联带宽16PB/s（超全球互联网峰值带宽10倍），计划2026年四季度上市 [9] - Atlas 950超节点对比英伟达NVL144：卡规模为其56.8倍，总算力为其6.7倍，内存容量1152TB为其15倍，互联带宽16.3PB/s为其62倍；相比Atlas 900，训练性能提升17倍至4.91M TPS，推理性能提升26.5倍至19.6M TPS [10] - 发布基于Ascend 960的Atlas 960超节点：最大支持15488卡，由220个机柜组成，占地面积约2200平方米，FP8总算力30E FLOPS，FP4总算力60E FLOPS，内存容量4460TB，互联带宽34PB/s，训练/推理性能相比Atlas 950提升3倍/4倍以上至15.9M TPS/80.5M TPS，计划2027年四季度上市 [11][13] 鲲鹏处理器与通用计算超节点 - 鲲鹏处理器围绕支持超节点、多核高性能方向演进，2026年一季度将推出Kunpeng 950处理器，含96核/192线程和192核/384线程两个版本，支持通用计算超节点，新增四层隔离实现机密计算 [14] - 发布全球首个通用计算超节点TaiShan 950：基于Kunpeng 950打造，最大支持16节点32个处理器，最大内存48TB，支持内存/SSD/DPU池化，计划2026年一季度上市 [16] - TaiShan 950结合GaussDB多写架构，无需分布式改造即可实现性能提升2.9倍，平滑替代大型机/小型机及Oracle Exadata；在虚拟化环境内存利用率提升20%，Spark大数据场景实时处理时间缩短30% [16][17] - 提出混合超节点概念：结合TaiShan 950和Atlas 950，构建PB级共享内存池支持超高维度用户特征，并提供超大AI算力支持超低时延推理，为下一代生成式推荐系统提供新架构 [17] 超节点互联技术突破 - 攻克大规模超节点互联两大挑战：通过系统性创新实现长距离（超200米）高可靠光互联（可靠性提升100倍）以及大带宽（TB级）低时延（2.1微秒）互联 [18][19] - 推出超节点互联协议“灵衢”（UB - UnifiedBus），具备总线级互联、平等协同等六大特征；灵衢1.0已随Atlas 900商用部署300多套，Atlas 950基于灵衢2.0，华为将开放灵衢2.0以共建生态 [19][20] - 超节点架构核心价值为“万卡超节点，一台计算机”，通过灵衢协议将数万计算卡联接成一体工作 [19] 超级计算集群规划 - 发布Atlas 950 SuperCluster集群：由64个Atlas 950超节点互联组成，集成52万多片昇腾950DT卡，FP8总算力524E FLOPS，支持UBoE与RoCE协议（推荐UBoE），计划2026年四季度上市 [21] - Atlas 950 SuperCluster集群规模为xAI Colossus的2.5倍，算力为其1.3倍，支持千亿至十万亿参数大模型训练 [22] - 规划Atlas 960 SuperCluster集群：规模达百万卡级，FP8总算力2 ZFLOPS，FP4总算力4 ZFLOPS，支持UBoE与RoCE，计划2027年四季度推出 [22]

观察者网· 2025-09-18 13:24

芯片产品规划 - 昇腾950系列芯片支持FP8/MXFP8/MXFP4等低数值精度格式，算力达1P-2P FLOPS，自研HiF8格式精度接近FP16，包含面向Prefill场景的950PR和面向Decode场景的950DT两款合封芯片，均计划2026年上市 [3] - 昇腾960芯片性能较950翻倍，支持自研HiF4格式，推理精度优于业界FP4方案，计划2027年四季度推出 [7] - 昇腾970芯片FP4/FP8算力及互联带宽较960全面翻倍，内存访问带宽提升1.5倍，计划2028年四季度推出 [7] - 鲲鹏950处理器包含96核/192线程和192核/384线程两个版本，为首款支持机密计算的数据中心处理器，计划2025年一季度推出 [13] - 鲲鹏960处理器包含96核/192线程高性能版和不少于256核/512线程高密版，计划2028年一季度推出 [13] 超节点系统 - Atlas 950超节点基于8192颗昇腾950DT芯片构建，包含160个机柜（128计算柜+32互联柜），占地1000平方米，FP8算力达8E FLOPS，FP4算力达16E FLOPS，互联带宽16PB/s（超全球互联网峰值带宽10倍），计划2026年四季度上市 [11] - 对比英伟达NVL144系统，Atlas 950芯片规模为其56.8倍，总算力为其6.7倍，内存容量1152TB为其15倍，互联带宽16.3PB/s为其62倍 [11] - Atlas 960超节点基于15488颗昇腾960芯片构建，包含220个机柜（176计算柜+44互联柜），占地2200平方米，FP8算力30E FLOPS，FP4算力60E FLOPS，内存容量4460TB，互联带宽34PB/s，计划2027年四季度推出 [13] - TaiShan 950超节点为全球首款通用计算超节点，基于鲲鹏950处理器，最大支持32处理器/48TB内存，支持内存/SSD/DPU池化，计划2025年一季度上市 [13] 算力集群架构 - Atlas 950 SuperCluster集群由64个Atlas 950超节点互联组成，集成52万片昇腾950DT芯片，FP8总算力524E FLOPS，规模为xAI Colossus集群2.5倍，算力为其1.3倍 [18] - Atlas 960 SuperCluster集群计划2027年四季度推出，规模达百万卡级，FP8总算力2Z FLOPS，FP4总算力4Z FLOPS [19] - 自研"灵衢（UB）"互联协议支持万卡级超节点架构，具备总线级互联/平等协同/全量池化等六大特性，并开放灵衢2.0技术规范构建生态 [17] 软件生态战略 - CANN编译器与虚拟指令集接口开放，其余软件全开源，基于昇腾910B/C的开源计划2025年12月31日前完成 [22] - Mind系列应用使能套件及工具链全面开源，计划2025年12月31日前完成 [22] - openPangu基础大模型全面开源 [22] 技术突破方向 - 自研两种低成本HBM内存技术，分别适配Prefill推荐场景和Decode训练场景 [3] - 通过光通信/网络/供电技术集成384颗昇腾芯片构建超节点，计算与通信高速并行，已部署超300套 [10] - TaiShan 950超节点结合GaussDB多写架构可实现大型机/小型机替代，性能提升2.9倍 [15] - 推出TaiShan 950与Atlas 950混合超节点，支持PB级推荐系统嵌入表和超低时延推理 [15]

中国基金报· 2025-09-18 13:23

昇腾芯片发展规划 - 公司规划未来三年推出昇腾950、960、970三个系列芯片 [2][5] - 芯片演进速度将达到几乎一年一代且算力翻倍 [2][4][5] - 昇腾950系列相比前代有四大根本性提升：新增支持FP8/MXFP8/MXFP4等低数值精度格式，算力达1P和2P；通过提升向量算力占比等设计大幅提升向量算力；互联带宽达2TB/s，较昇腾910C提升2.5倍；自研HiBL1.0和HiZQ 2.0两种HBM与Die合封 [5] - 昇腾960计划于2027年四季度推出，在算力、内存访问带宽等规格上较昇腾950全面翻倍，并支持自研HiF4数据格式 [6] - 昇腾970初步计划FP4算力、FP8算力、互联带宽较昇腾960翻倍，内存访问带宽至少增加1.5倍 [7] 超节点与集群产品 - 公司发布Atlas 950超节点、Atlas 960超节点、TaiShan 950超节点三款超节点产品 [9] - 推出新型互联协议“灵衢”，并开放灵衢2.0技术规范以促进产业生态 [9][10] - Atlas 950 SuperCluster集群规模是当前世界最大集群xAI Colossus的2.5倍，算力是其1.3倍 [10] - 计划在2027年四季度基于Atlas 960超节点推出Atlas 960 SuperCluster，集群规模将提升至百万卡级 [10]

Atlas 950 SuperCluster集群

Atlas 950 SuperCluster集群

ETF日报：目前国产算力发展趋势树立，科技行业有望迎来较大级别的发展良机

新浪基金· 2025-09-18 12:30

市场表现 - 三大指数冲高回落沪指跌1.15% 深成指跌1.06% 创业板指跌1.64% [1] - 沪深两市成交额3.135万亿元较上一交易日放量7584亿元创年内第三高 [1] - 半导体板块强势冲高后回落半导体设备ETF收涨4% 科创芯片ETF收涨2.28% [1] - 港股科技ETF收跌1.57% [4] 华为AI算力布局 - 华为公布AI算力全景图芯片以一年一代算力翻倍速度发展 [2] - 昇腾950PR芯片预计2026年Q1推出 950DT于2026年Q4推出 960芯片于2027年Q4推出 970芯片于2028年Q4推出 [2] - Atlas 900超节点累计部署超300套服务20多个客户 [2] - Atlas 950超节点2026年Q4上市 960超节点2027年Q4上市 [2] - 发布Atlas 950 SuperCluster集群支持50万卡 Atlas 960 SuperCluster支持百万卡 [2] 半导体产业动态 - 中芯国际测试上海宇量昇28nm深紫外光刻机采用多重曝光技术生产7nm芯片 [3] - 光刻机国产替代率接近0% 技术突破难度最大 [3] - 英伟达违反反垄断法遭市场监管总局进一步调查 [3] - 英伟达在华销售持续受阻国产算力替代率有望大幅提升 [3] 投资配置方向 - 通信ETF含光模块+服务器+铜连接+光纤含量超78% 代表北美算力 [4] - 创业板人工智能ETF光模块占比超51% [4] - 国产算力关注半导体设备ETF 科创芯片ETF 芯片ETF 集成电路ETF [4] 美联储政策影响 - 美联储降息25基点至4-4.25% 释放10月继续降息信号 [5] - 点阵图显示今年三次降息鲍威尔定位为"风险管理型降息" [5] - 港股与美股相关系数接近95% [5] - 历史非衰退式降息后恒生指数震荡走强科技行业降息后12个月平均上涨88% [5][6] 港股科技板块机遇 - AI为科技行业核心赛道港股聚集中国科技核心资产 [7] - 港股通科技指数长期跑赢恒生科技指数和港股通互联网指数 [7] - 科技行业有望迎基本面与估值戴维斯双击 [7] - 港股科技ETF覆盖互联网新能源车芯片生物医药等多领域 [7]

傅里叶的猫· 2025-09-18 11:15

华为昇腾芯片路线图 - 华为发布Ascend系列芯片路线图，涵盖2025年至2028年多款产品，包括Ascend 910C（2025 Q1）、Ascend 950PR（2026 Q1）、Ascend 950DT（2026 Q4）、Ascend 960（2027 Q4）和Ascend 970（2028 Q4）[3] - 芯片微架构从SIMD逐步升级至SIMD/SIMT混合架构，支持数据格式包括FP32、HF32、FP16、BF16、FP8、MXFP8、HiF8、MXFP4和HiF4[3] - 互联带宽从784 GB/s（Ascend 910C）提升至4 TB/s（Ascend 970），计算能力从800 TFLOPS FP16（Ascend 910C）提升至4 PFLOPS FP8和8 PFLOPS FP4（Ascend 970）[3] - 内存容量从128 GB（Ascend 910C）增至288 GB（Ascend 960和970），内存带宽从3.2 TB/s（Ascend 910C）提升至14.4 TB/s（Ascend 970）[3] 华为超节点产品 - Atlas 900超节点支持384颗Ascend 910C芯片，总算力达300 PFLOPS，已部署超300套CloudMatrix384服务实例[6] - Atlas 950超节点基于Ascend 950DT，支持8192张卡（为Atlas 900的20多倍），由160个机柜组成，占地1000平方米，FP8算力达8 EFLOPS，FP4算力达16 EFLOPS，互联带宽16 PB/s（超全球互联网峰值带宽10倍）[7] - Atlas 950超节点相比英伟达NVL144（2025下半年上市）卡规模为其56.8倍，总算力为其6.7倍，内存容量1152 TB为其15倍，互联带宽16.3 PB/s为其62倍[7][8] - Atlas 960超节点基于Ascend 960，支持15488张卡，由220个机柜组成，占地2200平方米，FP8算力30 EFLOPS，FP4算力60 EFLOPS，内存容量4460 TB，互联带宽34 PB/s，训练和推理性能较Atlas 950提升3倍和4倍[8] 光模块需求与市场 - 2024年全球光模块需求约800万只，英伟达需求超300万只，谷歌需求超200万只[12] - 2025年需求预计1800-2100万只，英伟达需求超500万只，谷歌需求约350万只，Meta需求250-300万只，AWS需求约300万只[12] - 2026年需求预计3000-3200万只，英伟达需求350-400万只，谷歌需求400-500万只，Meta需求约600万只，AWS需求约550万只[12] - 2026年800G光模块需求可能超预期，主因微软需求未被充分统计，实际需求或远超250万只[12] 1.6T光模块需求 - 2025年1.6T光模块需求主要来自英伟达，规模250-350万只（其中100万只给代工链），谷歌需求20-30万只，Meta和AWS需求可忽略[13] - 2026年1.6T光模块保守需求约860万只，英伟达需求至少500万只（其中100-150万只给代工链），谷歌需求约150万只，Meta和AWS需求各约80万只[14] 光模块产能与供需 - 头部三家厂商2026年产能合计3500-4000万只，产能利用率约80%，可生产数量约2800-3200万只[16] - 2026年800G+1.6T乐观需求近5000万只，存在1000-1500万只供需缺口[16] GPU与光模块配比 - 英伟达GPU与光模块配比为1:3至1:4.5，主要针对三层架构和800G光模块[17] - 谷歌配比约1:14，2026年需求较可观[17] - AWS当前配比1:4，自研ASIC后预计提升至1:8[17] - Meta实际配比1:12至1:14（含多规格光模块），自研ASIC后用量上升[17] 光模块供应商份额 - Meta供应商中菲尼萨份额30%-40%，新易盛份额20%-30%，旭创份额约20%[18] - 谷歌2025年供应商中旭创份额约70%，CloudLight份额约20%，菲尼萨份额约10%[18] - AWS供应商中新易盛份额60%-70%，菲尼萨份额约15%，旭创份额超20%，CloudLight份额5%-10%[18] - 微软供应商较杂，旭创份额20%-30%，新易盛份额10%-20%，菲尼萨份额10%-20%，设备厂商订单占比30%-40%[18] - 英伟达800G市场以旭创和菲尼萨为主，1.6T市场为旭创、菲尼萨和新易盛[18]

半导体芯闻· 2025-09-18 10:40

华为昇腾芯片技术演进 - 昇腾芯片持续演进为中国及全球AI算力提供基础未来3年规划三个系列芯片包括Ascend 950/960/970系列 [2][3] - Ascend 950系列即将推出包含两颗芯片：950PR面向推理Prefill和推荐场景 950DT面向推理Decode和训练场景 [3][4] - 相比前代Ascend 910C Ascend 950实现根本性提升：新增支持FP8/MXFP8/MXFP4等低精度格式 FP8算力达1 PFLOPS FP4算力达2 PFLOPS 互联带宽提升2.5倍至2TB/s [3][4][5] - 采用自研HBM技术：950PR采用HiBL 1.0 HBM 降低成本 950DT采用HiZQ 2.0 HBM 内存容量达144GB 带宽达4TB/s [4][5] - Ascend 960规划于2027Q4推出各项规格相比950翻倍 FP8算力达2 PFLOPS FP4算力达4 PFLOPS 支持HiF4格式 [6][7] - Ascend 970规划于2028Q4推出相比960 FP8算力翻倍至4 PFLOPS FP4算力翻倍至8 PFLOPS 互联带宽翻倍至4TB/s 内存带宽提升1.5倍 [7] 超节点产品布局 - Atlas 900超节点已部署300多套满配384颗Ascend 910C芯片算力达300 PFLOPS 服务20多个客户 [8] - 新发布Atlas 950超节点基于Ascend 950DT 支持8192张卡是Atlas 900规模的20多倍 FP8算力达8 EFLOPS FP4算力达16 EFLOPS 互联带宽达16PB/s 超全球互联网峰值带宽10倍 2026Q4上市 [9][10] - 相比英伟达NVL144 Atlas 950卡规模是其56.8倍总算力是其6.7倍内存容量达1152TB是其15倍互联带宽达16.3PB/s是其62倍 [10] - Atlas 950超节点训练性能提升17倍达4.91M TPS 推理性能提升26.5倍达19.6M TPS [10][11] - Atlas 960超节点规划于2027Q4 基于Ascend 960 支持15488卡 FP8总算力达30 EFLOPS FP4总算力达60 EFLOPS 内存容量达4460TB 互联带宽达34PB/s 训练和推理性能相比950提升3倍和4倍以上 [11] 集群解决方案 - Atlas 950 SuperCluster集群由64个Atlas 950超节点组成集成52万多片昇腾950DT卡 FP8总算力达524 EFLOPS 2026Q4上市 [19] - 相比xAI Colossus集群华为集群规模是其2.5倍算力是其1.3倍 [20] - Atlas 960 SuperCluster规划于2027Q4 规模达百万卡级 FP8总算力达2 ZFLOPS FP4总算力达4 ZFLOPS [20] - 集群支持UBoE和RoCE协议 UBoE相比RoCE静态时延更低可靠性更高节省交换机和光模块数量 [20] 通用计算超节点 - 鲲鹏处理器围绕超节点方向演进 2026Q1推出Kunpeng 950处理器两个版本：96核/192线程和192核/384线程支持通用计算超节点新增四层隔离安全特性 [12] - 发布TaiShan 950通用计算超节点基于Kunpeng 950 最大支持16节点32个处理器内存48TB 支持内存/SSD/DPU池化 2026Q1上市 [14] - TaiShan 950助力金融系统替代大型机/小型机结合GaussDB多写架构无需分布式改造性能提升2.9倍 [14][15] - 在虚拟化环境内存利用率提升20% Spark大数据场景实时处理时间缩短30% [15] - 支持构建混合超节点结合TaiShan 950和Atlas 950 为生成式推荐系统提供PB级共享内存池和超低时延推理能力 [15] 互联技术创新 - 华为开创超节点互联协议"灵衢"（UB）灵衢1.0已用于Atlas 900超节点灵衢2.0用于Atlas 950超节点将开放给产业界共建生态 [17][18][19] - 解决长距离高可靠互联问题光互联可靠性提升100倍距离超200米 [16][17] - 解决大带宽低时延问题实现TB级带宽和2.1微秒时延 [16][17] - 万卡超节点架构具备六大特征：总线级互联、平等协同、全量池化、协议归一、大规模组网、高可用性 [17]

华为AI芯片计划全盘托出！全球最强超节点+超级集群，未来2年全面领先

量子位· 2025-09-18 10:33

文章核心观点 - 华为通过系统架构和互联技术创新在AI算力集群层面实现全面超越预计未来两年保持全球算力领先地位[3][5][30] - 公司公布昇腾系列芯片详细演进路线坚持"一年一代算力翻倍"技术迭代节奏[7][8][21] - 推出全球首个通用计算超节点重塑AI和通用计算基础设施范式[45][48][49] 芯片产品规划昇腾950系列 - 昇腾950PR：面向推荐和推理场景采用自研HBM内存方案降低成本 2026年第一季度上市[10][11][12][14] - 昇腾950DT：面向训练场景互联带宽提升2.5倍支持自研HBM 2026年第四季度上市[16][17][18][19] - 昇腾960：旗舰训练芯片规格较950实现翻倍提升 2027年第四季度上市[21][22] - 昇腾970：训练芯片全面升级 FP4/FP8算力翻倍内存带宽提升1.5倍 2028年第四季度上市[24][25][26] 鲲鹏系列 - 鲲鹏950处理器：支持96核/192线程和192核/384线程两种版本新增四层安全隔离 2026年第一季度上市[46][52] 超节点系统 Atlas 950超节点 - 支持8,192张昇腾950DT芯片规模为Atlas 900的20多倍[32] - 关键指标：FP8算力8 EFlops FP4算力16 EFlops 互联带宽16.3 PB/s（超全球互联网总带宽10倍）内存容量1152 TB[35] - 较英伟达NVL144卡规模达56.8倍总算力6.7倍内存容量15倍互联带宽72倍[37] - 2026年第四季度上市预计未来两年保持全球算力第一[38] Atlas 960超节点 - 支持15,488张昇腾960/950DT芯片采用跨柜全光互联[40] - 关键指标全面翻倍：FP8算力30 EFlops FP4算力60 EFlops 内存容量4460 TB 互联带宽34 PB/s[43] - 训练总吞吐4.91百万TPS（较Atlas 900提升17倍）推理总吞吐19.6百万TPS（提升26.5倍）[42] - 2027年第四季度上市[41] 集群系统 Atlas 950 SuperPlus集群 - 由64个Atlas 950超节点并联整合52万颗昇腾950T芯片[57] - 总算力达524 EFlops 支持UBOE和RoCE两种组网协议[58] - 2026年第四季度上市[59] Atlas 960 SuperPlus集群 - 规模达百万卡级 FP8总算力2 ZFlops FP4达4 ZFlops[62] - 2027年第四季度上市[62] 通用计算超节点 - 泰山950超节点：全球首个通用计算超节点最大支持16节点32处理器内存48TB[48][49] - GaussDB读写架构性能提升2.9倍可平滑替代大型机小型机传统数据库[50] - 虚拟化环境内存利用率提升20% Spark大数据实时处理时间缩短30%[50] - 2026年第一季度上市[51] 技术创新 - 开创灵衢互联协议解决万卡超节点长距离高可靠互联难题[54] - 自研HBM方案HiZQ 2.0：内存容量144GB 访问带宽4TB/s 互联带宽2TB/s[27] - 支持Hi-F4数据格式业界最优4bit精度实现推理精度优于FP4方案[28]

人工智能

超节点

芯片

Atlas 950 SuperPlus集群

Atlas 960 SuperPlus集群

Atlas 950 SuperPlus集群

Atlas 960 SuperPlus集群

昇腾950系列芯片