Workflow
直击英伟达GTC
英伟达英伟达(US:NVDA)2025-04-15 14:30

行业与公司 * 行业涉及人工智能、高性能计算、数据中心基础设施、光通信、机器人及自动驾驶[1][2][10] * 公司为英伟达(NVIDIA),其发布了新一代AI芯片、交换机和AI模型及应用[1][2][9] 核心观点与论据 算力硬件升级 * 发布Blackwell Ultra NVLink 72(GB300)方案,带宽是前代GB200的两倍,计划于2024年下半年出货[2] * 发布Rubin架构芯片,其中VR Ruby(NVLink 144版本)计划于2026年下半年出货,性能是GB300 NVLink 72的3.3倍,推理速度比当前Blackwell芯片高一倍多,支持高达288GB快速内存[3] * 发布Rubin Ultra(NVLink 576版本),性能是GB300 NVLink 72的14倍,支持CX9网卡且带宽达115.2T,采用288张卡在一个机柜内的新架构[3][4] * 算力密度提升推动PCB(用量增长)、电源和液冷需求增长,因新架构在机柜内集成更多芯片[5] 互联技术突破 * 发布两款CPU交换机:Quantum X系列(IB架构)计划2024年下半年出货,Spectrum X系列(以太网版本)计划2026年下半年出货[6] * Quantum X交换机总带宽为115.2T,由4个ASIC、每个ASIC搭载6个光引擎小单元(每个含3个光引擎)、共72个硅光引擎组成,每个光引擎带宽1.6T(单通道200G,八通道)[6][7] * 光引擎通过Socket连接器与交换机芯片连接,实现可插拔设计,降低维护成本并可能促进下游CSV厂商采用[8] AI应用与模型 * 推出AI推理软件Dynamo,在运行DeepSeek R1模型时,每个GPU生成的token数提高超过30倍,通过动态调整GPU资源和优化数据卸载提升效率[9] * 推出通用机器人基础模型N1,采用双系统架构(快速思考动作模型和慢速思考决策模型),支持抓取、移动物体等动作[10] * 推出端到端自动驾驶全栈安全系统HALOS,结合汽车硬件、软件和AI研究以确保安全[10] * 强调推理需求将大幅提升,因模型引入强化学习导致token数量增加,看好算力产业链(包括海外和国内)[11] 其他重要内容 * 架构变化:NVLink 576版本机柜布局分为四个部分,每个部分类似NVLink 72结构,使用Compute Blade和Switch Blade,中间通过PCB互联(材料特殊且用量增长)[4][5] * 行业影响:可插拔光引擎设计略超预期,可能加速CPU交换机 adoption[8] * 未来计划:GTC将持续发布更新信息[11]