Workflow
GB200/300机架
icon
搜索文档
2025年出货量下调至2.73万台
傅里叶的猫· 2025-12-14 12:37
大摩对AI服务器ODM厂商的最新预测与排序 - 摩根士丹利每月提供ODM厂商的机架出货量预测,在主流GPU AI服务器ODM厂商中,其优先排序为纬创 > 鸿海 > 广达 [2] - 摩根士丹利对GB200/300机架的最新预测为2.73万个,较此前的2.8万个小幅下调,调整源于广达2025年第三季度财报电话会议后更新了预测 [2] 2025年第四季度机架产量预测调整 - 由于广达管理层对2025年第四季度AI业务增长的表述比摩根士丹利此前预期更为保守,摩根士丹利将广达2025年第四季度机架产量从约3500个下调至2500个 [7] - 由于纬创本季度表现出强劲增长势头,摩根士丹利将其2025年第四季度机架产量上调约300个,使得2025年整体机架产量仅减少700个 [7] - 摩根士丹利维持原有观点,即2025年第四季度机架产量将环比实现显著增长,从第三季度的8000-8500个增至1.35-1.4万个 [7] 重点ODM厂商业绩与出货分析:广达 - 广达11月营收约为1930亿新台币,环比增长11%,同比增长36% [13] - 营收环比增长主要得益于当月GB200/300机架出货量提升,预计达到1000-1100个,高于10月的850-900个 [13] - 若12月广达出货600-700个机架,其2025年第四季度机架产量有望达到约2600个,存在小幅上修空间 [13] 重点ODM厂商业绩与出货分析:纬创 - 纬创11月营收创下历史新高,达2810亿新台币,环比增长52%,同比增长195% [14] - 营收环比大幅增长主要源于产品迭代,其L10计算托盘出货量显著提升至1200-1300个机架当量,远高于10月的300-350个 [14] - 笔记本电脑出货量环比小幅增长5%至220万台,纬颖营收环比增长约6%至970亿新台币 [14] 重点ODM厂商业绩与出货分析:鸿海 - 根据摩根士丹利调研,鸿海11月GB200机架出货量环比持平,约为2600个 [15] - 预计受年底假期影响,12月服务器机架出货量将呈下滑趋势,因此维持其2025年第四季度机架产量7200个的预测 [15] 2026年初步展望 - 2026年机架出货量预测存在一定难度,但摩根士丹利假设约200万个Blackwell芯片库存将结转至明年,因此将2026年机架出货量预测上调至7-8万个,上月预测为6-7万个 [17] - 这一调整主要基于摩根士丹利台积电分析师Charlie Chan在12月初上调了2026年CoWoS业务预测 [17] - 在GPU ODM厂商排序上,摩根士丹利仍维持纬创 > 鸿海 > 广达的判断 [18] - 实际交付给终端客户的机架数量可能低于上述预测值,因为该预测包含了纬创L10计算托盘的机架当量数据,未计入L11机架的组装及测试时间 [18]
GB200出货量上修,但NVL72目前尚未大规模训练
傅里叶的猫· 2025-08-20 11:32
GB200/300机架出货预测 - 2025年GB200/300机架出货量从3万上调至3.4万,其中Q3预计出货1.16万,Q4预计出货1.57万 [3] - GB200与GB300机架占比分别为87%和13% [3] - 上调主要受鸿海强劲指引推动,鸿海预计Q3 AI机架出货量环比增长300%,全年出货量预估达1.95万,占市场约57% [3] - 假设200万颗Blackwell芯片库存结转至2026年,下游组装商可能组装超6万机架 [3] - 主要代工厂偏好顺序为鸿海>纬创>广达 [3] GB200 NVL72与H100成本对比 - H100服务器价格下降至每台19万美元,超大规模数据中心运营商每台总Capex约25万美元 [12] - GB200 NVL72机架级系统服务器成本约310万美元,超大规模运营商总成本约390万美元每机架 [12] - GB200 NVL72每GPU全包资本成本为H100的1.6-1.7倍 [13] - 超大规模运营商H100每GPU Capex约3.1358万美元,GB200 NVL72为5.4166万美元 [13] - GB200 NVL72每GPU每小时Opex为4.09美元,H100为3.04美元,差异主要源于GB200芯片功耗更高(1200W vs 700W) [14] GB200 NVL72与H100性能比较 - GB200 NVL72总拥有成本(TCO)为H100的1.6倍,需至少比H100快1.6倍才能占据优势 [15] - 截至2025年5月GB200 NVL72性能/TCO尚未超过H100,但7月达到H100的1.5倍,预测未来3-6个月可能达2.7倍 [30] - 2025年7月GB200 NVL72吞吐量在Token/s/GPU方面达H100的2.5倍,12月预测BF16性能比H100好4.7倍,MFU达42.0% [31] - DeepSeek 670B预训练14.8T Token成本在2025年7月为4.5M美元(BF16),预测12月降至2.5M美元 [32] 软件优化与能耗表现 - 2024年1月至12月软件优化使H100 BF16 MFU从34%提升至54%,FP8从29.5%提升至39.5% [20] - FP8训练成本从每百万Token 0.72美元降至0.542美元,300B Token总成本从218k美元降至162k美元 [20] - 训练Llama3 405B模型15T Token能耗相当于3400个美国家庭年能耗 [25] - Llama3 70B模型在2048台H100上训练FP8能耗比64台H100高出10% [29] GB200 NVL72可靠性挑战 - 早期GB200 NVL72运营商普遍面临XID 149错误,背板卡匣连接器金镀层耐用性仅200次插拔 [34] - GB200 NVL72 MTBI为1000-3000 GPU-天,低于H100的2000-5000 GPU-天 [36] - 目前GB200 NVL72仅用于推理、小实验和开发工作,未用于大规模训练 [35] 行业趋势与建议 - SemiAnalysis建议英伟达扩展基准并增加透明度,公开hyperscaler和NCP基准数据 [16] - 建议加速GB200 NVL72诊断工具开发,加强ODM/OEM验收测试 [17] - 软件优化是性能提升关键,GB200 NVL72有潜力但可靠性是瓶颈,预测年底将主导市场 [37]