超节点+集群 - 财报，业绩电话会，研报，新闻

超节点+集群

搜索文档

南方都市报· 2025-11-25 15:04

行业战略转变 - 国产AI芯片公司过去几年保持低调，官网很少更新最新产品信息和参数 [1] - 近期华为、百度等大厂接连公开AI芯片迭代路线图，阿里平头哥芯片亮相央视，标志着行业从“闷声做事”转向高调沟通 [1] - 这一转变是“里程碑式的转折”，公司需要向客户呈现清晰产品路线图以抢占英伟达留下的市场，并让投资者看到依赖国产算力发展的可能性 [2] 华为昇腾芯片路线图 - 华为宣布2026至2028年将推出四款昇腾AI芯片：950系列（950PR、950DT）、960和970 [4] - 950系列采用P/D分离路线：950PR于2026年Q1推出，面向推理预填充阶段和推荐业务，内存容量128GB，内存访问带宽1.6TB/s，互联带宽2TB/s；950DT于2026年Q4推出，注重推理解码和训练场景，内存容量144GB，内存访问带宽4TB/s，互联带宽2TB/s [7][8] - 960芯片于2027年Q4推出，互联带宽2.2TB/s；970芯片于2028年Q4推出，互联带宽4TB/s [5] - 华为Atlas 950超节点于2026年Q4推出，基于8192张950DT芯片；Atlas 960超节点于2027年Q4推出，最大支持15488张昇腾960芯片 [9] - 华为发布Atlas 950和960 SuperCluster超节点集群，算力规模分别超过50万卡和达到百万卡 [9] 百度昆仑芯路线图 - 百度公布昆仑芯业务路线图：2026年初上市针对大规模推理场景的M100芯片；2027年初上市面向超大规模多模态模型训练和推理的M300芯片 [11] - 2026年上半年和下半年推出“天池256超节点”和“天池512超节点”，搭载昆仑芯P800芯片，最高支持256张卡和512张卡互联 [11] - 从2027年下半年开始陆续推出千卡和四千卡超节点，计划2029年上市新一代N系列芯片，2030年点亮百万卡单集群 [11] - 基于昆仑芯P800的64卡超节点，单卡功耗约400瓦，FP16精度总算力规模超20 PFlops，单卡算力约为英伟达A100 SXM版本的一半 [11] 技术竞争格局 - 国产AI芯片在工艺制程、单卡算力、单卡内存容量和带宽等维度均落后于英伟达，但可借助超节点组网实现性能超越 [3] - 华为采用“超节点+集群”方案应对AI算力需求，这是“用数学补物理”策略，规避芯片制造工艺限制 [3][14] - 华为Atlas 950超节点满配由160个机柜组成，占地面积1000平方米，使用自研“灵衢”互联协议 [15] - 华为CloudMatrix 384超节点搭载384颗昇腾910C芯片，芯片数量是英伟达NVL72系统的五倍，可弥补单芯片性能仅为英伟达GB200三分之一的不足，但功耗为NVL72系统的4.1倍 [16] 市场应用与挑战 - 国产AI芯片用于大模型训练难度高，华为昇腾几乎是唯一可用于大模型训练的芯片，但当前主打型号910C大部分应用仍是推理 [19] - 使用全国产算力训练模型代价更高，不仅芯片使用成本高，训练时间也更长，例如科大讯花额外两个月进行适配 [20] - 2025年上半年中国GenAI IaaS服务市场中，推理场景占比上升至42%，训练场景占比降至58% [20] - 国产推理芯片已可满足当前最先进模型的使用，一台8张卡的单机能提供约688G显存，可运行DeepSeek R1-671B等600G权重的模型 [21] - 推理芯片市场竞争碎片化，包括GPGPU玩家（如海光信息、沐曦）和ASIC厂商（如寒武纪、华为、阿里平头哥） [21]

新浪财经· 2025-09-30 02:13

公司战略定位 - 公司在2025年全联接大会上首次完整公布“超节点+集群”算力战略，这是在2019年受制裁后交出的关键答卷 [2] - 公司选择通过系统架构创新来规避芯片制造受限的短板，以软实力补硬短板，是在极限制裁下被逼出来的创新范式 [6][7] - 公司的长远愿景是构建更大的AI自主生态，其AI自主也被视为中国AI的自主，旨在带动中国AI产业链协同发展 [17][22] 核心技术产品 - 公司发布Atlas 950 SuperPoD和Atlas 960 SuperPoD超节点，分别支持8192张及15488张昇腾卡 [9] - 公司Atlas 950超节点卡的规模是英伟达计划明年下半年上市的NVL144的56.8倍，总算力是其6.7倍，即使与英伟达计划2027年上市的NVL576相比也保持领先 [9] - 公司Atlas 950 SuperCluster和Atlas 960 SuperCluster的算力规模分别超过50万卡和达到百万卡，成为全球最强算力集群 [11] - 公司的秘密武器是自研的灵衢互联协议，能连接庞大计算资源，实现“规模越大，效率越高”，并于2025年全联接大会上正式开放灵衢2.0技术规范 [13][20] - 在昇腾芯片直至2028年的路线图上，公司承诺“几乎一年一代、算力翻倍” [17] 行业背景与趋势 - AI之争本质是算力之争，斯坦福《2025年人工智能指数报告》指出知名大模型的训练算力需求每5个月翻一番，大语言模型的训练数据集规模每8个月翻一番 [3] - 算力是人工智能过去和未来的关键，超节点通过专用互联技术将多张计算卡、多台机器逻辑上整合为“超级计算机”，是行业突围方向 [4] - AI当前发展阶段仅相当于移动通信的2G阶段，未来需要专门构建的算力基础设施 [9] 生态建设举措 - 公司将昇腾硬件使能CANN、Mind系列工具链、openPangu盘古大模型等关键工具全部开源，以建设算力生态 [17] - 公司坚持靠昇腾硬件变现，其他一切开源使用，以促进硬件规模化和普遍使用 [19] - 公司坚定选择不兼容英伟达CUDA生态，而是“另起炉灶”以实现全面AI生态自主 [22] - 公司的“超节点+集群”通过云平台开放算力，使中小企业可按需付费获取万亿级模型训练能力，推动AI技术普惠 [23] 系统性优势 - 公司基于三十多年光通信技术优势，实现多机柜长距离稳定联接，满足高带宽与低时延 [15] - 国内电力基础设施及“东数西算”等国家战略能为AI算力中心赋予强大的成本优势，是其他国家难以复制的系统性优势 [15] - 公司自研光模块、连接芯片、操作系统、数据库等，构建起全栈自主可控的技术体系 [17]

“超节点+集群”：华为闯出AI算力自主创新之路

科技日报· 2025-09-28 23:47

算力在数字经济与AI发展中的核心地位 - 算力被视为数字经济时代的发动机和人工智能发展的关键资源 [1] - 截至今年6月底，中国在用算力中心机架总规模达到1085万标准机架，智能算力规模为788 EFlops，位居全球前列 [1] - 迈向通用人工智能和世界模型需要海量算力作为支撑 [1] 华为“超节点+集群”算力解决方案 - 华为提出“超节点+集群”的差异化路径，以突破外部芯片制造工艺限制 [2] - 超节点通过整合算力芯片资源，在单个节点内构建低延迟、高带宽的算力实体，旨在提高算力利用效率以支撑千亿乃至万亿参数模型的训练和推理 [2] - 集群将多个超节点通过高速网络互联，并通过软件层统一调度，实现如云服务般的灵活性 [2] - 华为发布Atlas 950/960 SuperPoD超节点，分别支持8192张和15488张昇腾卡，并推出算力规模分别突破50万卡和达到百万卡的超节点集群 [3] - “超节点+集群”是华为在计算上的核心战略，计划以几乎一年一代、每代算力规模翻倍的速度演进 [3] - 该解决方案旨在为中国人工智能提供可持续、可拓展的算力底座 [3] - 尽管单颗芯片性能及昇腾生态与国际领先者相比仍有差距，但华为对通过计算架构创新满足国内AI算力需求充满信心 [4] 开源开放战略与算力生态建设 - 华为发布并开放超节点互联协议“灵衢2.0”的技术规范，以共建开放生态 [5][6] - 华为已宣布全面开源开放昇腾硬件使能CANN，加速开发者创新 [6] - 开源开放被视为促进硬件规模化使用和生态建设的关键，硬件规模化使用可弥补开源开放的投入 [6][7] - 开放智算生态和开源成标配已成为2025年人工智能产业关键词 [6] - 开源技术有助于降低算力成本，并推动AI开发模式向全系统创新转变 [6] - 中国正通过出台相关政策文件，为开源生态提供政策支持 [7] - 华为认为生态是通过使用发展起来的，需要开发者和合作伙伴共同努力 [7] AI产业的经济前景 - 根据中国电信研究院预测，到2035年，AI将为中国GDP贡献超过11万亿元 [3]