Workflow
GB300平台
icon
搜索文档
液冷新风向?英伟达要求供应商开发新散热技术
DT新材料· 2025-09-16 16:04
AI算力散热需求激增 - AI算力需求急剧增加 英伟达最新Rubin与下一代Feynman平台功耗预期突破2000W 现有散热方案难以满足需求[2] - 英伟达要求供应商开发全新微通道水冷板技术 其单价是现有散热方案的3至5倍 水冷板和均热片成为新战略物资[2] - 已有公司向英伟达送样MLCP 但MLCP不是唯一解决方案 多个新型散热方案仍在并行验证中[2] 微通道水冷板技术优势 - MLCP技术将传统覆盖芯片的金属盖与上方液冷板整合 内嵌微通道设计 使冷却液直接流经芯片表面[4] - 该技术减少中间介质使用 缩短热传递路径 显著提高散热效率并有效压缩散热系统体积[4] - 微通道技术是近两年产学研重点方向 业间关注度持续升高 正成为AI计算平台散热领域核心技术[4][6] 散热技术成本与效率 - 若GPU全面采用MLCP技术 制造成本将比现有Blackwell盖板高出5至7倍[2] - MLCP技术推动行业进入新阶段 成为散热技术重组分水岭[2] - 微通道技术在实际应用中能显著提高热管理效率 在不增加设备体积前提下极大提升散热能力[6] 散热需求与技术挑战 - Rubin GPU热功耗预计从1.8kW提升至2.3kW 超出现有冷板负荷[7] - 英伟达最快2026年下半年将MLCP技术引入Rubin GPU 双芯片版本中MLCP有望成为维持高效散热关键技术[7] - 单芯片版本Rubin GPU可能继续采用冷板设计 Vera CPU与交换器IC等组件仍将使用冷板散热[7] 技术实施时间表 - MLCP技术面临较高技术风险 液体渗透率和量产良率问题尚未充分解决[9] - 预计MLCP技术距离量产至少还有3至4个季度时间[9] - 散热厂 封装厂与组装厂协作模式仍在验证阶段 技术导入时间表取决于客户实际需求 并非所有机型都将采用此技术[9] 液冷技术发展现状 - 英伟达供应商Boyd宣布已向超大规模数据中心交付500万块液冷板[10] - 液冷技术正日益成为AI计算领域核心技术之一[10] - 冷板式液冷技术成熟度高 改造兼容性强 系统稳定性好 成为数据中心主流方案[12] 液冷系统组件 - 冷板液冷系统组件日益模块化 形成四大核心部件:液冷板 CDU 水冷歧管和快速接头[13] - 液冷板直接导热出GPU/CPU热量 CDU控制液体流量 压差 温度 水冷歧管负责多路分配与汇集冷却液 快速接头支持快速插拔连接和无泄漏拆装[13] GB300平台散热方案 - 英伟达2025年GTC大会发布GB300平台 单机TDP突破1.2kW 刷新AI服务器能耗上限[14] - GB300全面采用Direct-to-Chip冷板液冷方案 GB200 GB300与NVLink Switch三大模块均使用100%液冷散热[14] - 系统集成72颗Blackwell GPU和36颗Grace CPU 组成18个Grace Blackwell Superchip 所有GPU之间通过NVLink Switch System实现互联[15] 冷板配置变化 - GB300采用每个芯片配独立小冷板设计 为每块冷板配置一进一出快接头[18] - 相较GB200双GPU共用大冷板方式 GB300快接头使用量显著提升 整机快接头总数达252对[18] - 其他组件如manifold CDU以及cartridge等均沿用GB200原有设计 无需额外调整[18] 液冷技术供应商 - 主要液冷板供应商包括Cooler Master 奇鋐科技 Boyd 双鸿科技 台达 CoolIT Systems 富士康 Chilldyne 中石科技 深圳威铂驰 飞荣达 大图热控 英维克 精研科技和中航光电等[23][25][27][29][31][33][35][37][41][44][46][48][51][53][55] - 这些供应商为英伟达提供高效液冷板和冷却系统 广泛应用于高功耗AI平台和数据中心[23][25][27][29][31][33][35][37][41][44][46][48][51][53][55] 行业活动与展望 - 第六届热管理产业大会暨博览会将于12月3-5日举办 重点关注微通道水冷板技术和液冷技术最新进展[57][59] - 大会将汇聚行业顶尖专家 企业代表与学者 探讨如何应对AI计算平台散热挑战[57][59] - MLCP技术为行业提供新思路 有望成为未来高功耗AI平台核心散热解决方案 推动AI技术和数据中心架构革新[57]
英伟达电话会:“将Blackwell带到中国市场”的机会真实存在,今年毛利率仍有望达70%中段水平
美股IPO· 2025-08-28 04:59
全球AI资本支出预期 - 到2030年全球AI基础设施支出预计达3-4万亿美元 [5][12][45] - 前四大云服务提供商资本支出两年内翻倍至6000亿美元 [5][16][43] - 投资驱动因素包括推理代理AI、主权AI建设、企业AI采用及物理AI技术发展 [6][16] 英伟达财务表现与增长 - 2026财年Q2总收入467亿美元 数据中心收入同比增长56% [12] - Q3收入预期540亿美元(±2%) 环比增长超70亿美元 [27] - 非GAAP毛利率预计年底达70%中段水平 [8][28] - 主权AI收入今年预计达200亿美元 较去年增长一倍以上 [9][19] Blackwell架构技术优势 - Blackwell架构收入环比增长17% 需求非常旺盛 [3][12] - 每token能效相比Hopper提升50倍 投资回报达10倍(300万美元基础设施产生3000万美元token收入) [7][17] - 训练速度比H100快7倍 采用NVFP4 4位精度技术 [18] - 机架级NVLink72系统实现数量级性能提升 适用于大规模AI工厂 [32][67] 中国市场机遇与挑战 - 中国市场今年存在500亿美元商机 年增速预计50% [4][48] - H20芯片若获许可 Q3对华销售额可达20-50亿美元 [3][15] - 全球约50%AI研究人员在中国 开源模型生态活跃(如DeepSeek、Qwen、Kimi) [48] - 公司正推动Blackwell架构对华销售许可 [4][15][48] 产品与技术进展 - Rubin平台芯片已流片 计划2026年量产 含六类新型芯片 [14][68] - 网络业务收入73亿美元(环比增46% Spectrum-X年化收入超100亿美元) [20][21] - Thor机器人计算平台上市 AI性能比AGX Orin高一个数量级 [22] - GeForce游戏收入43亿美元(环比增14%) RTX 5060 GPU实现双倍性能 [24] 行业应用与生态扩展 - 欧盟计划投资200亿欧元建设20个AI工厂 包括5个超级工厂 [9][19] - 超过200万开发者及1000家合作伙伴采用机器人全栈平台 [22] - OpenAI、Meta、Mistral等公司部署GB200 NVL72用于训练与推理 [13] - 工业数字孪生平台Omniverse与西门子合作扩展AI自动化工厂 [23]