Rubin架构

搜索文档
英伟达GTC Keynote直击
2025-03-19 15:31
纪要涉及的行业和公司 - 行业:数据中心、科技股、算力产业链 - 公司:英伟达、台积电科沃斯、北美五大科技公司(Amazon、Microsoft、Apple、Google)、GM、小米、联想、比亚迪、中兴、阿里巴巴、腾讯、美团 纪要提到的核心观点和论据 数据中心产品 - 日本数据中心产品推出时间和 HBM 配置低于预期,第一代预计 2026 年推出,第二代预计 2027 年推出,第一代 HBM 容量 288GB 低于预期的 384GB [2][3][4] - 英伟达预计 2026 年推出 Rubin 架构,晚于预期的 2025 年,Rubin Ultra 展示新架构,GPU 单元增至 576 个,支持 NVLink 6 和 CX9 交换机,每个单元可搭载高达 1TB HBM [3][5] - CPO 技术通过集成光模块缩短传输距离、提高速度,新一代 Spectrum X 今年下半年随 Blacker 推出,Quantum X 明年下半年伴随下一代日本数据中心产品推出 [3][6] - GTC 大会提到 DGX BasePOD 和 DGX Station 等小型计算机项目,面向开发者市场,采用 Black Box 芯片,支持 FP4 精度及超 1,000 TOPS AI 计算能力 [3][7] 算力需求与收入 - 预训练模型规模迅速扩大,推动算力需求大幅增长,模型规模每年翻十倍,远超摩尔定律降本速度,英伟达数据中心收入激增,CSP 资本开支过去两年翻倍 [3][9][10] 推理阶段 - GTC 大会强调推理阶段重要性,如 DPC 模型带来需求增长,但应用场景能否推动推理需求仍需观察,英伟达通过软硬件降低 AI 推理成本,目标是降低 token 生成成本 [3][11][12] 科技股市场 - 今年初以来中国科技股跑赢美国科技股,从 Deep CQ 发布后已跑赢美国七大科技公司 44 个百分点,目前美股与 A 股差距缩小至约三十几个百分点,未来半年有望进一步拉近,可能出现美股下跌、港股上涨的“东升西降”趋势 [13] 重要产品发布及影响 - GTC 大会发布 GB300(现称 Blackberry Ultra 72)、Rubin 等产品,展示英伟达至少到 2028 年的 GPU 加速计算演进路线,新一代 CPU 和交换机系统将未来导入,对产业链产生深远影响 [14] 资本开支与出货量 - 2025 年北美五大科技公司资本开支预计比 2024 年增长 30%,较 2023 年几乎翻倍,下修机会不大 [3][16] - 台积电科沃斯产能预计到 2025 年底达 775,000 片,英伟达 GGB200 和 GB300 出货量预计在 2.5 万 - 3 万台之间,比 2024 年底的 4 万台有所下降,但金额能与五家厂商规模匹配 [17] 硬件需求与服务器价值量 - GB200 和 GB300 在 HBM 使用、功耗、算力、生产方式等方面有变化,GB300 使 CSP 厂商设计自由度提高 [15][18] - GB300 服务器价值量受影响,新一代产品对光模块需求有影响,主要在 2026 年体现 [19] 算力产业链前景 - 2025 年英伟达算力卡出货量预计在 25,000 - 23,000 之间,与现有 M72 服务器规模相当,带动工业互联等领域收入增长,但产业链仍面临压力 [20] 其他重要但可能被忽略的内容 - 英伟达展示与自动驾驶、机器人相关新合作与开源模型,如与 GM 合作推进自动驾驶技术,更多相关信息预计在 Computex 展会上公布 [8]
不止芯片!英伟达,重磅发布!现场人山人海,黄仁勋最新发声
21世纪经济报道· 2025-03-19 03:45
文章核心观点 英伟达GTC2025大会围绕AI推理时代展开,发布了涵盖计算架构、企业AI应用、数据中心、机器人和自动驾驶等领域的技术,构建完整AI生态体系,有望推动企业和个人生产力变革,虽发布会后股价下跌,但大会或提振AI市场部分正面情绪 [28][30] 分组1:大会概况 - 当地时间3月18日,英伟达创始人兼CEO黄仁勋在英伟达GTC2025大会发表演讲,称其为“AI界的超级碗”,今年关键词是“推理”和“token”,AI叙事重心从训练转向推理 [1] - Forrester副总裁兼首席分析师戴鲲认为大会有三个方向值得关注,分别是面向后训练和推理的加速计算、面向企业级智能代理开发的Agentic AI、AI在物理世界中的应用 [3] 分组2:芯片家族 - 英伟达发布Blackwell Ultra系列芯片及下一代GPU架构Rubin,Vera Rubin NLV144计划于2026年下半年上线,Rubin Ultra NVL576将于2027年下半年面世 [5] - Grace Blackwell已全面投入生产,新平台强化推理能力,Blackwell Ultra在训练和测试时间缩放推理方面实现突破,被称为“AI工厂平台” [6] - Blackwell Ultra(GB300)包含GB300 NVL72机架级解决方案和HGX B300 NVL16系统,GB300 NVL72 AI性能提升1.5倍,使AI工厂收益机会相比Hopper平台提高50倍;HGX B300 NVL16推理速度提高11倍、计算能力提升7倍、内存容量扩大4倍 [8][9] - 瑞银报告指出,Blackwell系列需求强劲,GB200瓶颈解决,英伟达加快B300/GB300推出,预计第一季度提前量产,2025年第三季度大规模出货 [10] - 基于Blackwell Ultra的产品预计2025年下半年由合作伙伴推出,思科、戴尔等将率先推出相关服务器,预计到2028年数据中心投资超一万亿美元,暗示英伟达有增长空间 [11] 分组3:CPO交换机 - 英伟达推出全新NVIDIA Photonics硅光子技术,通过共封装光学取代传统可插拔光学收发器,可降低40MW功耗,提高AI计算集群网络传输效率 [13] - 推出Spectrum-X与Quantum-X硅光子网络交换机,Spectrum-X以太网平台带宽密度达传统以太网1.6倍,Quantum-X光子Infiniband平台AI计算架构速度较前代提升2倍,可扩展性增强5倍 [14] - 英伟达光子交换机集成光通信创新技术,较传统方式减少75%激光器使用,能效提升3.5倍等;摩根大通报告指出CPO应用于GPU最早可能2027年实现,且面临多项技术挑战,对基板供应商是利好 [15] 分组4:软件升级 - 英伟达关注机器人、自动驾驶等领域,生成式AI改变计算方式,计算机成为token生成器,数据中心演变成AI工厂 [17] - 英伟达新推出AI推理服务软件Dynamo,支持下Blackwell推理性能可达上一代Hopper的40倍,能最大化AI工厂token收益,采用分离式推理架构实现高效AI推理计算 [18][19] - 英伟达推出Llama Nemotron系列推理模型和AI - Q,支持企业和开发者构建AI Agent,提升推理能力,减少开发成本和部署难度 [20] - 英伟达核心护城河CUDA是强大软硬件体系,已拥有各领域AI工具 [21] 分组5:端侧AI和机器人 - 英伟达推出基于NVIDIA Grace Blackwell平台的全新DGX个人AI超级计算机系列,包括DGX Spark和DGX Station,将原本仅限数据中心使用的架构性能引入桌面环境 [23][24] - 英伟达正式发布全球首款开源、可定制的通用人形机器人基础模型Isaac Groot(GROOT N1),采用双系统架构,可适配多种任务,已被多家机器人制造商采用 [25] - 英伟达推出一系列模拟框架和方案,在机器人基础模型和体系化解决方案上再次升级,摩根大通预计其在Physical AI方面会有更多突破 [26] 分组6:市场情绪 - 过去一季度AI领域变化大,英伟达GTC2025大会发布众多技术,但发布会结束后股价下跌3.43% [28] - 摩根大通报告指出整体AI市场情绪偏空,GTC大会有望提振部分正面情绪,改善Blackwell系统供应状况,预计2026年AI数据中心资本支出继续健康增长 [29]