Atlas 350标卡

搜索文档
中国AI高速路,华为给出开源开放方案
量子位· 2025-09-23 11:01
超节点技术架构创新 - 华为发布创新的超节点架构,覆盖数据中心到工作站的全场景产品线 [3] - Atlas 950 SuperPoD采用正交架构实现零线缆电互联和液冷接头浮动盲插设计,光模块液冷可靠性提升一倍 [4] - 创新的UB-Mesh递归直连拓扑网络支持8192卡无收敛全互联,以64卡为步长按需扩展 [4] - Atlas 850是业界首个企业级风冷AI超节点服务器,支持多柜灵活部署形成1024卡集群,无需改造现有风冷机房 [8] - Atlas 350标卡采用昇腾950PR芯片使向量算力提升2倍,推荐推理场景性能提升2.5倍 [10] - TaiShan 950 SuperPoD具备百纳秒级超低时延和Tb级超大带宽,提升数据库及大数据场景业务性能 [13] 性能对比优势 - Atlas 950超节点相比英伟达NVL144规模达56.8倍、总算力达6.7倍、内存容量达15倍(1152TB)、互联带宽达62倍(16.3PB/s) [5] - 对标英伟达2027年计划上市的NVL576仍保持领先优势 [6] - Atlas 950 SuperCluster规模达xAI Colossus的2.5倍,算力达1.3倍,成为全球最强算力集群 [48] 开源开放生态战略 - 全面开放超节点技术硬件包括NPU模组、风冷/液冷刀片、AI标卡等基础硬件 [18] - 开放灵衢协议和超节点参考架构,允许产业界基于技术规范自研产品 [17] - 操作系统灵衢组件全部开源并合入openEuler等社区,支持用户自行迭代维护 [20] - 昇腾CANN全面开源开放,Mind系列组件同步开源并支持PyTorch等开源社区 [20] - 通过开源降低适配成本,推动产业协同发展和行业场景化解决方案建设 [22][23] 灵衢协议技术特性 - 灵衢(UnifiedBus)是面向超节点的互联协议,实现资源池化、线性扩展和长稳可靠 [33] - 通过大带宽低时延互联网络统一通信协议,消除协议转换开销并实现全局资源池化 [31] - 解决传统集群规模扩大时效率下降和可靠性难题,使集群像单机一样协同工作 [32] - 协议全面开源支持自由开发系统调度软件,促进生态繁荣 [34][36] 产业应用与生态建设 - 超节点已服务于互联网、金融、运营商、电力、制造等行业 [29] - 构建开放的综合交通枢纽式生态,打破封闭式协议隔阂 [40][42] - 支持不同规模用户搭建AI高速路,实现硬件软件算法共建共赢 [51] - 形成AI时代自主可控的技术基座和标准话语权 [52] - 通过最大市场优势形成创新飞轮效应,类似新能源汽车发展路径 [53]
【招商电子】国产算力芯片链深度跟踪:华为披露AI芯片3年规划,国内自主可控加速发展
招商电子· 2025-09-19 15:21
华为全联接2025大会技术发布 - 华为发布灵衢超节点互联协议并宣布开发灵衢2.0技术规范,通过超节点架构实现多台物理机器深度互联,重新定义大规模算力新范式 [9][10] - 昇腾NPU未来三年路线图包括2026年推出950PR和950DT、2027年推出960、2028年推出970,其中950PR支持FP8算力1 PFLOPS并采用自研HBM,960算力为950的2倍水平 [2][15] - 鲲鹏CPU路线图显示2026Q4推出950、2028Q1推出960,持续支持超节点及高性能计算需求 [2][20] - Atlas 900 A3 SuperPoD支持384卡互联且算力达300 PFLOPS,已累计部署300多套 [2][22] - Atlas 950 SuperPoD支持8192卡方案,采用正交架构实现零线缆电互联,单柜功率100kW,总算力规模领先 [2][25] - Atlas 960 SuperPoD支持15448卡方案,FP8算力达30 EFLOPS,总互联带宽34 PB/s,计划2027Q4上市 [2][32] - 超节点集群产品Atlas 950 SuperCluster和960 SuperCluster算力规模分别超50万卡和达百万卡,计划2026Q4和2027Q4上市 [2][34] - 业界首个通算超节点Taishan 950 SuperPoD计划2026Q1推出,支持最大16节点和48TB内存,时延仅370纳秒 [2][44] - 企业级产品Atlas 850/860包含8个NPU,支持风冷需求,最大可形成1024卡集群 [2][49] - AI标卡Atlas 350采用昇腾950PR芯片,FP8算力850 TFLOPS,内存128GB,推荐推理场景性能提升2.5倍 [2][54] 国内AI算力芯片发展 - 海光激励计划设定2025-2027年营收同比增长目标为55%/45%/33%,三年CAGR 44%,对应收入142/206/275亿元 [3] - 寒武纪指引2025年营收50-70亿元,昆仑芯及阿里等自研芯片技术实力提升,国产替代进程加速 [3] - 中美博弈背景下本土AI算力芯片实力逐步提升,外交部回应停止采购英伟达部分芯片事件 [58] 半导体制造与设备国产化 - 国内光刻机产业链聚焦整机及光学/工作台/浸液系统等零部件,国产DUV整机落地将加速自主可控需求 [59] - 2026年国内先进逻辑产线扩产预期提速,中芯国际和华虹2025Q2稼动率环比上升,资本支出侧重先进制程 [62] - 长江存储三期公司成立带动先进存储扩产,国内设备/材料/零部件板块持续受益 [3][62] - 国内设备厂商2025Q2收入快速增长,产品迭代加速,先进产线国产替代率有望提升 [63] - 零部件厂商进入产能扩张阶段,材料领域掩膜板需求因多重曝光技术成倍增长 [63] 存储技术趋势与市场 - 推理侧存储需求提升,英伟达Rubin NVL144 CPX采用GDDR7替代HBM,通过存储提升算力效率 [4] - 2026年端侧产品放量,AI手机平均DRAM容量从8GB增至12-16GB,AI PC从12GB增至16-64GB,AI耳机NOR容量从64-128Mb增至256Mb [4] - 国内厂商如江波龙/佰维存储/德明利推出企业级存储解决方案,兆易创新和北京君正推进3D DRAM存算一体方案 [4] 投资方向聚焦 - 建议关注AI算力芯片/高端芯片制造/先进封装/存储/设备/材料/零部件/EDA/IP等方向 [5] - 具体覆盖代工/算力芯片/封测/设备/存储/EDA/IP/材料等细分领域标的 [5]
超节点架构创新,开源开放共筑全场景算力底座
中国能源报· 2025-09-18 09:10
超节点架构创新 - 公司推出创新的超节点架构 可将多台物理机器深度互联 实现逻辑层面像一台机器一样学习与推理 重新定义高效稳定可扩展的大规模有效算力新范式[1] - 超节点架构基于灵衢互联协议 具备资源池化、规模扩展、长稳可靠的关键特性 通过统一协议和内存编址使有效算力随集群规模线性扩展[2] - 该架构已通过Atlas 900 A3 SuperPoD实现商业化部署 累计部署300多套 服务于互联网、金融、运营商等20多个行业客户[2] 新产品发布 - 推出全液冷数据中心AI超节点Atlas 950 SuperPoD 采用正交架构实现零线缆电互联 液冷接头浮动盲插设计做到零漏液 光模块液冷可靠性提升一倍[4] - Atlas 950支持UB-Mesh递归直连拓扑网络 实现NPU全互联 以64卡为步长扩展 最大支持8192卡无收敛全互联[4] - 发布业界首款企业级风冷AI超节点服务器Atlas 850 搭载8张昇腾NPU 支持多柜部署形成1024卡集群 是业内唯一风冷机房超节点解决方案[4] - 推出AI标卡Atlas 350 采用昇腾950PR芯片使向量算力提升2倍 推荐推理场景性能提升2.5倍 支持4个灵衢端口互联实现资源池化[5] - 推出业界首款通算超节点Taishan 950 SuperPoD 具备370纳秒超低时延和2.8T超大带宽 显著提升数据库及大数据业务性能[5] 技术开放策略 - 全面开放灵衢协议和超节点参考架构 允许产业界基于技术规范自研相关产品或部件[6] - 开放NPU模组、风冷/液冷刀片、AI标卡、CPU主板等基础硬件 支持客户进行增量开发和产品设计[6] - 将操作系统灵衢组件全部开源 代码合入openEuler等开源社区 支持用户集成到现有系统并自行迭代维护[9] - CANN全面开源开放 Mind系列组件同步开源 优先支持PyTorch和vLLM等主流开源框架[9] 全场景算力布局 - 超节点产品覆盖大型数据中心、企业级数据中心和小型工作站等全场景算力需求[1] - 通过硬件开放和软件开源策略支持伙伴打造行业场景化解决方案 加速开发者自主创新[1][9] - 致力于与产业界共筑全场景算力底座 推动超节点技术走向普惠与协同创新[6][10]