Workflow
CM384
icon
搜索文档
超节点技术与市场趋势解析
傅里叶的猫· 2025-09-28 16:00
超节点领域的合作与方案 - 下游CSP大厂主要找服务器供应商定制整机柜产品 服务器厂商和国产GPU厂商也在规划自己的超节点机柜 但以NV方案为主[4] - 国内主流超节点方案包括腾讯ETH-X、NV NVL72或其变形、华为昇腾CM384、阿里磐久 这些已在市场推广或有客户购买 字节规划大模型以太网创新方案 以博通Tomahawk为主 还未推广 海光方案多为传统刀片式服务器 无类似创新方案[4] - ETH-X是腾讯开放生态 与博通、安费诺等电缆和PCIe厂商合作 主要推广方包括壁仞、壁仞华创和腾讯下游云公司 在甘肃庆阳数据中心有合作 使用博通Tomahawk作为交换机 PCIe switch处理GPU流量 安费诺处理静态通信 中航光电设计液冷散热[5] - 字节方案由华擎研发 与腾讯类似但GPU卡不同:腾讯用燧原S60、L600及未来卡 字节用寒武纪和自研ASIC卡 两者适配天数、沐曦、摩尔线程等国产GPU 但主GPU各有侧重[5] - 互联网大厂自研方案与华为384、海光96卡、摩尔跨柜方案本质不同在于应用偏向:CM384偏训练和大模型计算 腾讯ETH-X偏推理 字节大模型整机柜偏训练和高性能计算[5] - 服务器厂商需具备交换机和服务器开发能力 与博通、NV、国产GPU厂商有关系 在AI服务器8卡、16卡、32卡方案有市场占有度 才能进入CSP选型 目前入选供应商有华勤、华三、超聚变 浪潮和锐捷作为备用 海光独立生态[5] 市场占有率与供应商格局 - 超节点方案还未大规模占有市场 在传统AI服务器(8卡、16卡)中 浪潮占有率最高 其次H3C 再是宁畅、华勤 国产开放生态中 昇腾达80%-90%[6] - 从9月16日起 CSP大厂包括BAT被强制不能采购NV的合规卡 明年或后年国产卡需达30%-40% 目前比例约9:1和8:2 互联网厂商每年被约谈 但海外卡采购仍放大[6] - 字节今年海外:国内=8:2 明年升至6:4 阿里找华勤等在海外代做NV方案 已招标提供海外数据中心 阿里、字节、腾讯通过下游云公司代建计算中心 非直接持有 代建后签3-5年租赁协议[6] - 中兴通讯2025年高层调整 新郭总目标在阿里、字节占份额 目前在阿里AI服务器从末尾升至20%-25% 联想因盈利考核 在CSP份额低 字节10% 阿里腾讯个位数 2024-2025价格战参与低[6] - 阿里AI服务器份额:浪潮33%-35% 华勤23% 宁畅和华三各18% 通用服务器:浪潮30% 中兴27% 华勤18% 华三15%[7] - 腾讯AI服务器:华勤40% 浪潮23% 华三18% 通用:浪潮35% 超聚变30% 宁畅15%[7] - 字节AI和通用:浪潮和宁畅各35% 宁畅AI30%、通用28% H3C AI15%、通用18% 联想10% 英业达和富士康各5%[7] 厂商竞争与二线格局 - 浪潮在成本和报价竞争激进时总拿第一份额 最具竞争力 第二第三竞争不明朗 阿里中是中兴、华三、华勤 华勤成本弱但高层决策以份额为主 盈利次之 数据业务盈利率降[8] - 腾讯AI服务器研发标多给华勤 技术30%、报价50%、质量20% 故份额高 通用中超聚变主攻腾讯 报价商务积极 华勤份额基本0 字节浪潮和宁畅默契 第一第二[8][9] - 大厂浪潮优势:在字节2019自研ODM起步时支持最大 技术供应服务商务占优 在阿里腾讯靠报价[9] - 二线互联网厂商需求小 无规则 主流供应商不参与 美团只华三和超聚变合作 京东直接采买超聚变和浪潮 只有浪潮和超聚变等成本强厂商占比例 美团基本浪潮和超聚变份额[9] - 二线GPU厂商找服务器厂商共研超节点 因无华为海光生态优势、销售人员少、对玩法不熟 服务器厂商有渠道 二线GPU可借其客户生态 国际厂商有供应品牌优势 客户认可规范GPU[9] - 华为UBB模式互联和海光HL总线协议只限各自生态 非开放 目前CPU无强制 大家是否用华为或海光CPU不确定[9] - 国产服务器发展慢 AI生态迭代国外领国内一年 互联网领行业一年 国外800G刚批量 国内2026Q4兴起 行业2027年[9] 采购与自研芯片 - 腾讯阿里能买时偏NV卡 阿里平头哥:NV=3:7 字节NV:国产=7:3(前8:2) NV限购时 以租代购和带采解决开支需求 资本开支用不完时 有趋势挪到国产[10] - 阿里平头哥3.0对标A100 80% 字节ASIC推理对标H100 65%-70% H100更训 百度昆仑芯未详 平头哥4月前代工台积电 4-6中断、7恢复8停 后中芯国际 海外三星 合作伙伴浪潮和华擎[10] - 超节点趋势:国外业务模型数据千万级 单节点不满足、时延高 故扩8卡到64卡增算力减时延 国内未铺开 未来推理若数据增长单节点不足 或有大规模需求[10] - 国产GPU合作:浪潮和中兴主 沐曦华三华勤 燧原开放 超聚变负责 摩尔线程H3C浪潮多[10] 经济与技术方面 - 以华勤为例 AI服务器净利率1-2点 大厂毛利率7-8点 通用毛利率1-2% 无净利率 通用规模小 牺牲成本占市场 成本强厂商净利率最好5点[11] - 未来AI超节点后 净毛利升 从自控物料入手:单机100万 自控10万 低毛净 整柜两三百万 自控压上游价 增利润 加软件方案 提升附加值[11] - 软件方案:1000万超节点 软件增三四十万利润 若供应商能力足、CSP评估费用低于自研 由供应商做 主要担运维管理[11] - 超节点CPU比例升:至少16节点 每节点2CPU 共32 以384方案:2CPU+4GPU 与72方案(18节点36CPU)区别大 铜缆比例增 核心厂商安费诺和立讯[11]
阿里的磐久超节点和供应链
傅里叶的猫· 2025-09-27 10:14
阿里磐久超节点技术架构 - 采用双64 GPU超节点设计 每个计算节点配置4颗自研GPU 上下各16个计算节点 总计128个GPU [4][6] - 64个GPU为一组scale up单元 华为CM384包含384颗昇腾910C 英伟达NVL72包含72颗GPU [6][7] 互联技术对比 - 英伟达NVL72采用Cable Tray互联方式 Compute tray与Switch Tray通过线缆连接 使用NVLink私有协议 [8] - 华为CM384通过多机柜组成超节点 昇腾服务器与交换机采用线缆互联 [10] - 阿里采用无背板正交互联技术 计算节点横向放置 Switch节点纵向放置 直接插接无PCB中介 降低信号损耗 [12][14] 电光互联方案 - 英伟达NVL72的scale up使用铜连接 避免光互联带来的成本与功耗上升 [15] - 华为CM384采用全光互联 NPU与光模块比例达1:14 整系统需6912个400G光模块 导致高功耗与高成本 [15] - 阿里超节点在64 GPU组内scale up采用电互联(PCB/铜缆) ALink Switch间使用光互联 具体光模块数量未披露 [18][19] 系统性能参数 - 华为CM384系统算力达300 PFLOPS(BF16密集) 超越英伟达NVL72的180 PFLOPS 但系统功耗达559,378W 是英伟达145,000W的3.9倍 [21] - 华为HBM带宽1,229 TB/s 是英伟达576 TB/s的2.1倍 但能效比劣于英伟达(1.87 W/TFLOP vs 0.81 W/TFLOP) [21] - 阿里超节点功耗超300kW 介于英伟达与华为之间 未公布算力参数 [22] 生态与兼容性 - 阿里超节点宣称支持多厂商GPU/ASIC 但需兼容ALink私有协议 实际推广存在难度 [23] - 阿里自研GPU可兼容CUDA生态 构成当前阶段竞争优势 [24] 硬件互联架构 - 英伟达GB200与Grace CPU通过NVLink-C2C直连 [26] - 华为GPU/CPU均连接至UB Switch [25] - 阿里采用独立计算节点设计 GPU与CPU通过PCIe互联 连接线隐藏在机箱背部 [28][30] 服务器供应链分析 AI服务器集成 - 浪潮占据33%-35%市场份额 华勤占23% 某企业并列第三占18% [34] - 通用服务器领域浪潮占30% 中兴通讯占27% 华勤占18% 新华三占15% [34] - 中兴通讯目标夺取浪潮市场份额第一地位 [34] 液冷解决方案 - 高澜占30%份额 英维克占30%-40% 申菱环境占20%-30% [35] - 科华数据新进入液冷白名单 预计2026年业务扩张将稀释头部企业份额 [35] 光模块供应 - 华工科技为阿里云核心供应商 份额超25%-30% [35] - 光迅科技在400G光模块市占率30%-40% 800G模块已批量供货 采用JDM合作模式 [35] - 中际旭创与航锦科技等企业分食剩余份额 [35] PCB板技术升级 - 超节点主板层数达24-30层 超低损耗材料占比超60% 单卡价值量从900元升至1900元 [36] - 沪电股份为主力供应商 AI服务器PCB收入占比达35% 高端板毛利率超35% [36] - 沪电股份与深南电路合计占50%-60%份额 其余由国内主流PCB厂商分担 [36] 服务器电源供应 - 中恒电气与欧陆通为核心供应商 覆盖主要供应量 提供浸没式液冷集中供电电源 [37] - 科华数据新进入阿里UPS白名单 有望成为第三大供应商 此前已在腾讯占据较大份额 [37]
人工智能供应链:人工智能资本支出上调,而台积电 2026 年 CoWoS 供应量保持不变-Global Technology -AI Supply Chain AI capex revised up, while TSMC 2026 CoWoS supply unchanged
2025-08-05 08:17
全球科技行业AI供应链电话会议纪要分析 一、核心行业与公司 - **行业覆盖**:全球半导体产业链(AI芯片、先进封装、云计算基建)[1][2][4] - **重点公司**: - **晶圆代工**:台积电(TSMC)、三星、GlobalFoundries - **AI芯片**:英伟达(NVIDIA)、AMD、博通(Broadcom)、华为昇腾 - **封装测试**:日月光(ASE)、Amkor、Alchip - **设备商**:Advantest、AllRing Tech(CoWoS设备)[4][27] 二、核心观点与论据 1. AI资本支出超预期增长 - **2026年全球云资本支出预测**:上调至5,820亿美元(同比+31%),显著高于市场共识的+16% [1][2][10] - **AI服务器支出占比提升**:隐含2026年AI服务器capex同比增速达~70% [2][11] - **头部云厂商驱动**:微软/亚马逊/谷歌占2025年capex上调额的90%,2025年四大云厂商经营现金流预计达5,500亿美元 [9][59] 2. 台积电CoWoS产能动态 - **2026年产能规划**:维持93k wpm(晶圆/月)预估,低于部分投资者预期的115k [4][26][27] - **支撑因素**:Blackwell芯片2025年强劲产出(预计510万颗),NVL72服务器机架按计划达3万台 [27][33] - **限制因素**:中国版B40 GPU无需HBM和CoWoS封装 [4][27] - **客户分配变化**: - **英伟达**:2026年CoWoS需求从58万片上调至59.5万片(含Rubin架构芯片240万颗)[22] - **AMD**:MI355系列新增CoWoS-L需求7万片 [22] - **AWS+Alchip**:Trainium3芯片推动CoWoS需求从4万片上调至5万片 [28] 3. 中国AI芯片供应链 - **替代方案**:华为CM384服务器性能达2115-307 PFLOPS(FP16),但网络带宽(784GB/s)仍落后于英伟达NVL72(1.8TB/s)[41][43] - **生产动态**: - 英伟达H20订单新增20万片(台积电生产)[8] - AMD MI308中国订单新增5-10万片 [8] - 华为昇腾910C进入商用阶段 [44] 三、关键数据与预测 1. 半导体制造 - **2025年AI芯片收入**:预计145亿美元(台积电主导,占65%份额)[48][57] - **HBM需求**:2025年预计达15.6亿GB(同比翻倍),英伟占72%份额 [50][58] - **CoWoS需求增长**:2026年全球需求达100.4万片(同比+48%)[20][37] 2. 技术指标对比 | 指标 | 英伟达NVL72 | 华为CM384 | |--------------------|-------------------|-------------------| | FP16算力(PFLOPS) | 180 | 2115-307 | | 内存带宽(TB/s) | 576 | 1229 | | 互联技术 | NVLink Gen5 | UBLink | | 发布时间 | 2024年3月 | 2025年4月 | [43] 四、潜在风险 1. **CoWoS设备商预期差**:AllRing Tech等可能因产能扩张不及预期(93k vs 市场115k)承压 [4][27] 2. **中国技术限制**:BIS延迟发放英伟达出口许可证影响短期供应 [8] 3. **资本开支周期**:2026年云capex增速可能从2025年的59%放缓至31% [10][67]