Workflow
Atlas 960超节点
icon
搜索文档
华为一口气发布多款芯片
半导体行业观察· 2025-09-19 01:29
公众号记得加星标⭐️,第一时间看推送不会错过。 来源 : 内容来自半导体行业观察综合 。 在今天开幕的华为全联接大会2025上,华为徐直军做了"以开创的超节点互联技术,引领AI基础设施 新范式"为题的演讲。徐直军首先重申了华为于2025年8月5日在北京专门举办的昇腾产业峰会上提出 的四个观点: 一、华为坚持昇腾硬件变现; 二、CANN 编译器和虚拟指令集接口开放,其它软件全开源,CANN基于Ascend 910B/C的开源开放 将于2025年12月31日前完成,未来开源开放与产品上市同步; 三、Mind系列应用使能套件及工具链全面开源,并于2025年12月31日前完成; 四、openPangu基础大模型全面开源。 "尽管DeepSeek开创的模式可以大幅减少算力需求,但要走向AGI、要走向物理AI,我们认为,算 力,过去是,未来也将继续是人工智能的关键,更是中国人工智能的关键。其中,算力的基础是芯 片,昇腾芯片是华为AI算力战略的基础。 自2018年发布Ascend 310芯片,2019年发布Ascend 910芯片,到2025年,Ascend 910C芯片随着 Atlas 900超节点规模部署,华为昇腾的进 ...
徐直军详解华为最强“算力核弹”
观察者网· 2025-09-18 13:24
芯片产品规划 - 昇腾950系列芯片支持FP8/MXFP8/MXFP4等低数值精度格式,算力达1P-2P FLOPS,自研HiF8格式精度接近FP16,包含面向Prefill场景的950PR和面向Decode场景的950DT两款合封芯片,均计划2026年上市 [3] - 昇腾960芯片性能较950翻倍,支持自研HiF4格式,推理精度优于业界FP4方案,计划2027年四季度推出 [7] - 昇腾970芯片FP4/FP8算力及互联带宽较960全面翻倍,内存访问带宽提升1.5倍,计划2028年四季度推出 [7] - 鲲鹏950处理器包含96核/192线程和192核/384线程两个版本,为首款支持机密计算的数据中心处理器,计划2025年一季度推出 [13] - 鲲鹏960处理器包含96核/192线程高性能版和不少于256核/512线程高密版,计划2028年一季度推出 [13] 超节点系统 - Atlas 950超节点基于8192颗昇腾950DT芯片构建,包含160个机柜(128计算柜+32互联柜),占地1000平方米,FP8算力达8E FLOPS,FP4算力达16E FLOPS,互联带宽16PB/s(超全球互联网峰值带宽10倍),计划2026年四季度上市 [11] - 对比英伟达NVL144系统,Atlas 950芯片规模为其56.8倍,总算力为其6.7倍,内存容量1152TB为其15倍,互联带宽16.3PB/s为其62倍 [11] - Atlas 960超节点基于15488颗昇腾960芯片构建,包含220个机柜(176计算柜+44互联柜),占地2200平方米,FP8算力30E FLOPS,FP4算力60E FLOPS,内存容量4460TB,互联带宽34PB/s,计划2027年四季度推出 [13] - TaiShan 950超节点为全球首款通用计算超节点,基于鲲鹏950处理器,最大支持32处理器/48TB内存,支持内存/SSD/DPU池化,计划2025年一季度上市 [13] 算力集群架构 - Atlas 950 SuperCluster集群由64个Atlas 950超节点互联组成,集成52万片昇腾950DT芯片,FP8总算力524E FLOPS,规模为xAI Colossus集群2.5倍,算力为其1.3倍 [18] - Atlas 960 SuperCluster集群计划2027年四季度推出,规模达百万卡级,FP8总算力2Z FLOPS,FP4总算力4Z FLOPS [19] - 自研"灵衢(UB)"互联协议支持万卡级超节点架构,具备总线级互联/平等协同/全量池化等六大特性,并开放灵衢2.0技术规范构建生态 [17] 软件生态战略 - CANN编译器与虚拟指令集接口开放,其余软件全开源,基于昇腾910B/C的开源计划2025年12月31日前完成 [22] - Mind系列应用使能套件及工具链全面开源,计划2025年12月31日前完成 [22] - openPangu基础大模型全面开源 [22] 技术突破方向 - 自研两种低成本HBM内存技术,分别适配Prefill推荐场景和Decode训练场景 [3] - 通过光通信/网络/供电技术集成384颗昇腾芯片构建超节点,计算与通信高速并行,已部署超300套 [10] - TaiShan 950超节点结合GaussDB多写架构可实现大型机/小型机替代,性能提升2.9倍 [15] - 推出TaiShan 950与Atlas 950混合超节点,支持PB级推荐系统嵌入表和超低时延推理 [15]
徐直军,最新发声!
中国基金报· 2025-09-18 13:23
【导读】华为轮值董事长徐直军:未来3年,昇腾芯片将以"几乎一年一代算力翻倍"的速度演 进 中国基金报记者 王建蔷 9月18日,华为全联接大会2025在上海召开,华为轮值董事长徐直军分享了昇腾芯片未来三 年的发展规划路线,并推出全球最强超节点和集群。 他透露,未来3年, 华为开发和 规划了三个系列,分别是Ascend(昇腾)950系列以及 Ascend 960、Ascend 970系列,更多具体芯片还在规划中。此外,以昇腾芯片为基础,华 为推出多款超节点和集群产品,到2027年昇腾超节点集群规模将达到百万卡级。 未来3年 昇腾芯片将以"几乎一年一代算力翻倍"的速度演进 徐直军认为,尽管DeepSeek模式减少了算力需求,但走向AGI和物理AI,算力仍是关键,尤 其是对中国人工智能而言。 他明确表示,未来3年至2028年,华为规划了Ascend 950、960、970三个系列昇腾芯片, 将以"几乎一年一代算力翻倍"的速度演进,同时,围绕易用性、数据格式、带宽等方向优 化,满足AI算力增长需求。 徐直军介绍,Ascend 950系列(含Ascend 950PR和Ascend 950DT两颗芯片)共用 Ascend ...
ETF日报:目前国产算力发展趋势树立,科技行业有望迎来较大级别的发展良机
新浪基金· 2025-09-18 12:30
市场表现 - 三大指数冲高回落 沪指跌1.15% 深成指跌1.06% 创业板指跌1.64% [1] - 沪深两市成交额3.135万亿元 较上一交易日放量7584亿元 创年内第三高 [1] - 半导体板块强势冲高后回落 半导体设备ETF收涨4% 科创芯片ETF收涨2.28% [1] - 港股科技ETF收跌1.57% [4] 华为AI算力布局 - 华为公布AI算力全景图 芯片以一年一代算力翻倍速度发展 [2] - 昇腾950PR芯片预计2026年Q1推出 950DT于2026年Q4推出 960芯片于2027年Q4推出 970芯片于2028年Q4推出 [2] - Atlas 900超节点累计部署超300套 服务20多个客户 [2] - Atlas 950超节点2026年Q4上市 960超节点2027年Q4上市 [2] - 发布Atlas 950 SuperCluster集群支持50万卡 Atlas 960 SuperCluster支持百万卡 [2] 半导体产业动态 - 中芯国际测试上海宇量昇28nm深紫外光刻机 采用多重曝光技术生产7nm芯片 [3] - 光刻机国产替代率接近0% 技术突破难度最大 [3] - 英伟达违反反垄断法遭市场监管总局进一步调查 [3] - 英伟达在华销售持续受阻 国产算力替代率有望大幅提升 [3] 投资配置方向 - 通信ETF含光模块+服务器+铜连接+光纤含量超78% 代表北美算力 [4] - 创业板人工智能ETF光模块占比超51% [4] - 国产算力关注半导体设备ETF 科创芯片ETF 芯片ETF 集成电路ETF [4] 美联储政策影响 - 美联储降息25基点至4-4.25% 释放10月继续降息信号 [5] - 点阵图显示今年三次降息 鲍威尔定位为"风险管理型降息" [5] - 港股与美股相关系数接近95% [5] - 历史非衰退式降息后恒生指数震荡走强 科技行业降息后12个月平均上涨88% [5][6] 港股科技板块机遇 - AI为科技行业核心赛道 港股聚集中国科技核心资产 [7] - 港股通科技指数长期跑赢恒生科技指数和港股通互联网指数 [7] - 科技行业有望迎基本面与估值戴维斯双击 [7] - 港股科技ETF覆盖互联网 新能源车 芯片 生物医药等多领域 [7]
光模块需求量和出货量
傅里叶的猫· 2025-09-18 11:15
华为昇腾芯片路线图 - 华为发布Ascend系列芯片路线图,涵盖2025年至2028年多款产品,包括Ascend 910C(2025 Q1)、Ascend 950PR(2026 Q1)、Ascend 950DT(2026 Q4)、Ascend 960(2027 Q4)和Ascend 970(2028 Q4)[3] - 芯片微架构从SIMD逐步升级至SIMD/SIMT混合架构,支持数据格式包括FP32、HF32、FP16、BF16、FP8、MXFP8、HiF8、MXFP4和HiF4[3] - 互联带宽从784 GB/s(Ascend 910C)提升至4 TB/s(Ascend 970),计算能力从800 TFLOPS FP16(Ascend 910C)提升至4 PFLOPS FP8和8 PFLOPS FP4(Ascend 970)[3] - 内存容量从128 GB(Ascend 910C)增至288 GB(Ascend 960和970),内存带宽从3.2 TB/s(Ascend 910C)提升至14.4 TB/s(Ascend 970)[3] 华为超节点产品 - Atlas 900超节点支持384颗Ascend 910C芯片,总算力达300 PFLOPS,已部署超300套CloudMatrix384服务实例[6] - Atlas 950超节点基于Ascend 950DT,支持8192张卡(为Atlas 900的20多倍),由160个机柜组成,占地1000平方米,FP8算力达8 EFLOPS,FP4算力达16 EFLOPS,互联带宽16 PB/s(超全球互联网峰值带宽10倍)[7] - Atlas 950超节点相比英伟达NVL144(2025下半年上市)卡规模为其56.8倍,总算力为其6.7倍,内存容量1152 TB为其15倍,互联带宽16.3 PB/s为其62倍[7][8] - Atlas 960超节点基于Ascend 960,支持15488张卡,由220个机柜组成,占地2200平方米,FP8算力30 EFLOPS,FP4算力60 EFLOPS,内存容量4460 TB,互联带宽34 PB/s,训练和推理性能较Atlas 950提升3倍和4倍[8] 光模块需求与市场 - 2024年全球光模块需求约800万只,英伟达需求超300万只,谷歌需求超200万只[12] - 2025年需求预计1800-2100万只,英伟达需求超500万只,谷歌需求约350万只,Meta需求250-300万只,AWS需求约300万只[12] - 2026年需求预计3000-3200万只,英伟达需求350-400万只,谷歌需求400-500万只,Meta需求约600万只,AWS需求约550万只[12] - 2026年800G光模块需求可能超预期,主因微软需求未被充分统计,实际需求或远超250万只[12] 1.6T光模块需求 - 2025年1.6T光模块需求主要来自英伟达,规模250-350万只(其中100万只给代工链),谷歌需求20-30万只,Meta和AWS需求可忽略[13] - 2026年1.6T光模块保守需求约860万只,英伟达需求至少500万只(其中100-150万只给代工链),谷歌需求约150万只,Meta和AWS需求各约80万只[14] 光模块产能与供需 - 头部三家厂商2026年产能合计3500-4000万只,产能利用率约80%,可生产数量约2800-3200万只[16] - 2026年800G+1.6T乐观需求近5000万只,存在1000-1500万只供需缺口[16] GPU与光模块配比 - 英伟达GPU与光模块配比为1:3至1:4.5,主要针对三层架构和800G光模块[17] - 谷歌配比约1:14,2026年需求较可观[17] - AWS当前配比1:4,自研ASIC后预计提升至1:8[17] - Meta实际配比1:12至1:14(含多规格光模块),自研ASIC后用量上升[17] 光模块供应商份额 - Meta供应商中菲尼萨份额30%-40%,新易盛份额20%-30%,旭创份额约20%[18] - 谷歌2025年供应商中旭创份额约70%,CloudLight份额约20%,菲尼萨份额约10%[18] - AWS供应商中新易盛份额60%-70%,菲尼萨份额约15%,旭创份额超20%,CloudLight份额5%-10%[18] - 微软供应商较杂,旭创份额20%-30%,新易盛份额10%-20%,菲尼萨份额10%-20%,设备厂商订单占比30%-40%[18] - 英伟达800G市场以旭创和菲尼萨为主,1.6T市场为旭创、菲尼萨和新易盛[18]
华为披露芯片路线图,详情披露
半导体芯闻· 2025-09-18 10:40
华为昇腾芯片技术演进 - 昇腾芯片持续演进 为中国及全球AI算力提供基础 未来3年规划三个系列芯片 包括Ascend 950/960/970系列 [2][3] - Ascend 950系列即将推出 包含两颗芯片:950PR面向推理Prefill和推荐场景 950DT面向推理Decode和训练场景 [3][4] - 相比前代Ascend 910C Ascend 950实现根本性提升:新增支持FP8/MXFP8/MXFP4等低精度格式 FP8算力达1 PFLOPS FP4算力达2 PFLOPS 互联带宽提升2.5倍至2TB/s [3][4][5] - 采用自研HBM技术:950PR采用HiBL 1.0 HBM 降低成本 950DT采用HiZQ 2.0 HBM 内存容量达144GB 带宽达4TB/s [4][5] - Ascend 960规划于2027Q4推出 各项规格相比950翻倍 FP8算力达2 PFLOPS FP4算力达4 PFLOPS 支持HiF4格式 [6][7] - Ascend 970规划于2028Q4推出 相比960 FP8算力翻倍至4 PFLOPS FP4算力翻倍至8 PFLOPS 互联带宽翻倍至4TB/s 内存带宽提升1.5倍 [7] 超节点产品布局 - Atlas 900超节点已部署300多套 满配384颗Ascend 910C芯片 算力达300 PFLOPS 服务20多个客户 [8] - 新发布Atlas 950超节点 基于Ascend 950DT 支持8192张卡 是Atlas 900规模的20多倍 FP8算力达8 EFLOPS FP4算力达16 EFLOPS 互联带宽达16PB/s 超全球互联网峰值带宽10倍 2026Q4上市 [9][10] - 相比英伟达NVL144 Atlas 950卡规模是其56.8倍 总算力是其6.7倍 内存容量达1152TB是其15倍 互联带宽达16.3PB/s是其62倍 [10] - Atlas 950超节点训练性能提升17倍达4.91M TPS 推理性能提升26.5倍达19.6M TPS [10][11] - Atlas 960超节点规划于2027Q4 基于Ascend 960 支持15488卡 FP8总算力达30 EFLOPS FP4总算力达60 EFLOPS 内存容量达4460TB 互联带宽达34PB/s 训练和推理性能相比950提升3倍和4倍以上 [11] 集群解决方案 - Atlas 950 SuperCluster集群由64个Atlas 950超节点组成 集成52万多片昇腾950DT卡 FP8总算力达524 EFLOPS 2026Q4上市 [19] - 相比xAI Colossus集群 华为集群规模是其2.5倍 算力是其1.3倍 [20] - Atlas 960 SuperCluster规划于2027Q4 规模达百万卡级 FP8总算力达2 ZFLOPS FP4总算力达4 ZFLOPS [20] - 集群支持UBoE和RoCE协议 UBoE相比RoCE静态时延更低 可靠性更高 节省交换机和光模块数量 [20] 通用计算超节点 - 鲲鹏处理器围绕超节点方向演进 2026Q1推出Kunpeng 950处理器 两个版本:96核/192线程和192核/384线程 支持通用计算超节点 新增四层隔离安全特性 [12] - 发布TaiShan 950通用计算超节点 基于Kunpeng 950 最大支持16节点32个处理器 内存48TB 支持内存/SSD/DPU池化 2026Q1上市 [14] - TaiShan 950助力金融系统替代大型机/小型机 结合GaussDB多写架构无需分布式改造 性能提升2.9倍 [14][15] - 在虚拟化环境内存利用率提升20% Spark大数据场景实时处理时间缩短30% [15] - 支持构建混合超节点 结合TaiShan 950和Atlas 950 为生成式推荐系统提供PB级共享内存池和超低时延推理能力 [15] 互联技术创新 - 华为开创超节点互联协议"灵衢"(UB) 灵衢1.0已用于Atlas 900超节点 灵衢2.0用于Atlas 950超节点 将开放给产业界共建生态 [17][18][19] - 解决长距离高可靠互联问题 光互联可靠性提升100倍 距离超200米 [16][17] - 解决大带宽低时延问题 实现TB级带宽和2.1微秒时延 [16][17] - 万卡超节点架构具备六大特征:总线级互联、平等协同、全量池化、协议归一、大规模组网、高可用性 [17]
华为AI芯片计划全盘托出!全球最强超节点+超级集群,未来2年全面领先
量子位· 2025-09-18 10:33
文章核心观点 - 华为通过系统架构和互联技术创新 在AI算力集群层面实现全面超越 预计未来两年保持全球算力领先地位[3][5][30] - 公司公布昇腾系列芯片详细演进路线 坚持"一年一代 算力翻倍"技术迭代节奏[7][8][21] - 推出全球首个通用计算超节点 重塑AI和通用计算基础设施范式[45][48][49] 芯片产品规划 昇腾950系列 - 昇腾950PR:面向推荐和推理场景 采用自研HBM内存方案降低成本 2026年第一季度上市[10][11][12][14] - 昇腾950DT:面向训练场景 互联带宽提升2.5倍 支持自研HBM 2026年第四季度上市[16][17][18][19] - 昇腾960:旗舰训练芯片 规格较950实现翻倍提升 2027年第四季度上市[21][22] - 昇腾970:训练芯片全面升级 FP4/FP8算力翻倍 内存带宽提升1.5倍 2028年第四季度上市[24][25][26] 鲲鹏系列 - 鲲鹏950处理器:支持96核/192线程和192核/384线程两种版本 新增四层安全隔离 2026年第一季度上市[46][52] 超节点系统 Atlas 950超节点 - 支持8,192张昇腾950DT芯片 规模为Atlas 900的20多倍[32] - 关键指标:FP8算力8 EFlops FP4算力16 EFlops 互联带宽16.3 PB/s(超全球互联网总带宽10倍) 内存容量1152 TB[35] - 较英伟达NVL144卡规模达56.8倍 总算力6.7倍 内存容量15倍 互联带宽72倍[37] - 2026年第四季度上市 预计未来两年保持全球算力第一[38] Atlas 960超节点 - 支持15,488张昇腾960/950DT芯片 采用跨柜全光互联[40] - 关键指标全面翻倍:FP8算力30 EFlops FP4算力60 EFlops 内存容量4460 TB 互联带宽34 PB/s[43] - 训练总吞吐4.91百万TPS(较Atlas 900提升17倍) 推理总吞吐19.6百万TPS(提升26.5倍)[42] - 2027年第四季度上市[41] 集群系统 Atlas 950 SuperPlus集群 - 由64个Atlas 950超节点并联 整合52万颗昇腾950T芯片[57] - 总算力达524 EFlops 支持UBOE和RoCE两种组网协议[58] - 2026年第四季度上市[59] Atlas 960 SuperPlus集群 - 规模达百万卡级 FP8总算力2 ZFlops FP4达4 ZFlops[62] - 2027年第四季度上市[62] 通用计算超节点 - 泰山950超节点:全球首个通用计算超节点 最大支持16节点32处理器 内存48TB[48][49] - GaussDB读写架构性能提升2.9倍 可平滑替代大型机小型机传统数据库[50] - 虚拟化环境内存利用率提升20% Spark大数据实时处理时间缩短30%[50] - 2026年第一季度上市[51] 技术创新 - 开创灵衢互联协议 解决万卡超节点长距离高可靠互联难题[54] - 自研HBM方案HiZQ 2.0:内存容量144GB 访问带宽4TB/s 互联带宽2TB/s[27] - 支持Hi-F4数据格式 业界最优4bit精度实现 推理精度优于FP4方案[28]