英伟达GB200 NVL72系统
搜索文档
成本惊人!英伟达“烧钱”散热
证券时报网· 2025-11-07 00:21
英伟达AI服务器液冷组件价值 - 英伟达GB300 NVL72机架级AI系统的液冷散热组件价值高达49860美元(约合人民币近36万元),比GB200 NVL72系统高约20% [2] - 下一代Vera Rubin NVL144平台的散热总价预计每个机柜将增长17%,达到约55710美元(约合人民币近40万元) [2] - 下一代平台中,为交换机托架设计的冷却模块预计价值将显著增长67% [2] 数据中心散热需求与趋势 - 数据中心CPU和GPU性能提升导致功耗激增,散热成本上涨趋势明显 [3] - 英伟达芯片功率不断突破上限,从H100的700W TDP,到B200的1000W,GB200的1200W,未来Vera Rubin(VR200)平台GPU最大TDP将飙升至2300W,2027年的VR300(Kyber架构)高达3600W [4] - 液冷已从数据中心散热备选方案变为必需品,以应对高密度算力设备的散热需求 [4] 英伟达液冷技术路线演进 - 早期GB200采用单板单向冷板+风冷组合方案,冷板覆盖CPU、GPU等高温区,风冷负责电源等低温部件 [4] - 新一代GB300全面升级为全冷板液冷方案,可稳定应对1400瓦散热需求 [4] - 面向未来Rubin芯片的超高功耗场景,英伟达已布局两相冷板液冷与静默式(浸没式)液冷耦合方案 [4] 中国液冷服务器市场预测 - 预计2025年中国液冷服务器市场规模达33.9亿美元,同比增长42.6% [5] - 2025至2029年复合增长率将保持48%的超高增速,2028年市场规模有望突破162亿美元 [5] - 英伟达相关芯片配套的液冷需求占据核心份额,成为市场增长的主要引擎 [5] 液冷概念股市场表现与机构关注 - 多只液冷概念股年内股价翻番,包括思泉新材、英维克、科创新源、同飞股份等 [7] - 多只概念股今年前三季度归母净利润同比翻倍,包括依米康、同飞股份、科创新源、飞荣达等;高澜股份、曙光数创、思泉新材、依米康、同飞股份等营收同比增幅超50% [7] - 多只概念股获机构集中调研,冰轮环境、银轮股份、飞龙股份、中石科技、思泉新材、同飞股份获调研机构在100家及以上 [7] 液冷概念公司业务布局 - 冰轮环境旗下公司为数据中心乃至液冷系统提供一次侧冷源装备和热交换装置等冷却装备 [7] - 银轮股份明确数据中心液冷1+2+N发展战略规划,远期展望数据中心热管理会超过数字与能源事业部整体规模的50% [7] - 飞龙股份液冷领域产能可以支持业务快速增长,子公司安徽航逸科技有限公司已拥有4条液冷领域生产线 [7] - 中石科技全新VC吸液芯散热技术已应用于国内大客户新一代AI PC中 [7] - 同飞股份在数据中心领域推出了冷板式液冷和浸没液冷全套解决方案 [8]
淡水泉投资解读WAIC:AI产业竞争格局加速重构
新浪基金· 2025-08-15 07:42
模型竞争态势 - 大模型厂商从同质化竞争转向差异化布局 部分企业聚焦长文本处理 部分深耕多模态能力 部分侧重工具调用或垂直场景开发[2] - 行业正探索开源与闭源混合模式 OpenAI及智谱等部分开源模型 Meta却在开发高阶闭源产品[2] - 头部厂商从纯模型提供商转型为融合生成 检索 工具调用等能力的综合平台 强化生态核心地位[2] 云计算生态变革 - 互联网云厂商构建以模型为中心的全栈能力 基础模型覆盖大语言 多模态 编程等领域 配套开发编程辅助 阅读助手等应用工具[3] - 云厂商将大模型深度嵌入600余个业务场景 提供企业级解决方案[3] - 推出模型即服务平台实现服务AI化升级 可能改变企业上云逻辑 中小企业或转向公有云平台获取AI能力[3] 国产算力进展 - 华为展出昇腾384超节点集群算力达英伟达GB200 NVL72系统的2倍[4] - 国产GPU在单卡性能上逼近英伟达H20 但在内存带宽和互联能力等推理性能关键指标上仍有差距[4] - 通过协同创新寻求突破 沐曦与阶跃联合发布解决方案 燧原携手互联网云厂商共建智算中心[4] 端侧AI发展现状 - 端侧AI面临多模态感知 交互和自主决策能力突破需求 硬件端存在机械结构 显示续航等技术难题[5] - 智能手机因算力 交互及场景优势可能成为AI智能体的首选载体[5] - 端侧Agent多步推理发展遵循先在云端平台验证 再向手机端迁移的路径[5]
绩后暴跌21%,AI算力神话要凉?
格隆汇APP· 2025-08-14 10:33
公司背景与市场表现 - CoreWeave成立于2017年,由三位前华尔街精英创立,最初从事加密货币挖矿,2019年转型为英伟达GPU算力租赁服务商[2] - 英伟达直接持股7%,为其提供独家技术支持,包括全球首家大规模商用Blackwell GPU,部署超过25万个高端GPU,资源调配速度比传统云服务商快35倍,成本仅为20%[2] - 2024年微软贡献62%营收,与OpenAI签订5年119亿美元合同,股价从上市首日40美元最高涨至187美元(3个月涨幅超3倍)[2] - Q2财报后股价暴跌21%,主要因EPS为-0.6美元(预期-0.52美元),净亏损从510万美元扩大至1.308亿美元[3] 财务与运营数据 - Q2营收12.13亿美元(同比+206%),超预期10.8亿美元,但增速较Q1的420%放缓[3] - Q2资本开支达29亿美元(环比+10亿美元),Q3计划29-34亿美元,全年指引200-230亿美元[3] - 调整后营业利润1.998亿美元(同比+134%),利润率16%,但Q3指引1.6-1.9亿美元低于预期的1.92亿美元[4] - 未完成订单(RPO)达301亿美元(同比+86%),含OpenAI扩展合作的40亿美元(总交易价值159亿美元)及两家超大规模客户新订单[4] 技术优势与战略布局 - 全球首个上线英伟达GB200NVL72系统,B200实例全面开放,MLPerf Training v5.0测试规模比竞品大34倍,性能高4.5倍[5] - 收购Weights&Biases推出三款AI工具链产品,收购Conductor切入视觉特效市场(相关云服务增长超4倍)[6] - 拟议收购CoreScientific可消除超100亿美元租赁负债,达产后年省5亿美元,新增1.3吉瓦电力容量(未来再扩1吉瓦)[7] - 当前电力容量470兆瓦,新增600兆瓦后达2.2吉瓦,目标2025年底超900兆瓦[7] 行业竞争与资本开支 - 数据中心扩张包括宾夕法尼亚州60亿美元项目和新泽西州250兆瓦AI园区(与BlueOwl合资,2026年投用)[7] - 大部分资本支出集中在2025Q4,对应GPU上线时间为2026年初,推测与微软2026年算力需求规划相关[7] - 商业模式类似亚马逊早期云服务投入,当前市场对亏损容忍度降低,但未完成订单显示长期需求潜力[7][4]
用“系统工程”打破算力封锁 昇腾的另类突围路径
每日经济新闻· 2025-06-17 05:56
昇腾算力技术突破 - 昇腾384超节点已开始发货,这是目前业界规模最大的超节点,由384颗昇腾AI芯片组成集群,提供高达300 PFLOPs的密集BF16算力,性能接近英伟达GB200 NVL72系统的两倍 [1] - 华为通过系统工程方法优化计算、内存、通信调度,实现算力超越,内部组织算力会战整合各领域专家能力 [1] - 昇腾超节点采用全对等高速互联架构,打破传统以CPU为中心的冯诺依曼架构,扩展总线至整机柜甚至跨机柜 [7] 国产算力发展背景 - 美国对华芯片出口管制持续加码,影响英伟达约55亿美元的季度费用 [2] - 昇腾算力战略意义远超商业价值,正从被迫替代转向主动选择 [3][5] - 昇腾计算产业已发展为包括芯片、硬件、CANN、AI计算框架等全产业链体系 [4] 技术架构创新 - 采用自有标准"全对等互联架构",统一通信协议提升有效载荷,打造基于中国标准的解决方案 [8] - 引入光通信技术,使用3168根光纤和6912个400G光模块实现跨机架纵向扩展 [8] - 解决散热难题,采用液冷散热方案和高效风冷方案,研发微结构材料提升热传导效率 [8] 软件生态建设 - 华为CANN平台快速补齐高质量基础算子,核心算子从数万个收敛至数百个 [10] - 提供Day0迁移和一键部署工具链,支持客户采用混合策略逐步迁移至昇腾平台 [10] - 组建"小灵巧突击队"深入客户现场提供技术支持 [6] 能耗与性能平衡 - 昇腾384超节点功耗达英伟达NVL72的4.1倍,每FLOP功耗高出2.5倍 [11] - 国内电力供应相对充裕,无需受限于能耗约束 [11] - 将持续通过技术进步改进能源消耗,构筑AI时代核心竞争力 [11] 行业影响与意义 - 昇腾384超节点打破了国产算力"无法训练大模型"的质疑 [12] - 构建了英伟达之外的可靠第二选择 [12] - 开辟了不同于西方的创新路径,通过系统工程实现规模算力领先 [12]
CoreWeave大规模上线英伟达GB200服务器
快讯· 2025-04-17 06:00
文章核心观点 AI云计算提供商CoreWeave大规模部署英伟达GB200 NVL72系统,Cohere、IBM和Mistral AI成为首批用户,该系统性能大幅提升将加速大模型训练和推理能力 [1] 分组1 - AI云计算提供商CoreWeave成为首批大规模部署英伟达GB200 NVL72系统的云服务提供商之一 [1] - Cohere、IBM和Mistral AI成为英伟达GB200 NVL72系统的首批用户 [1] - 英伟达GB200 NVL72系统在最新MLPerf基准测试中提供前代H100芯片2 - 3倍的性能提升 [1] - 英伟达GB200 NVL72系统将显著加速大模型训练和推理能力 [1]