Nvidia-直击英伟达GTC

行业与公司 * 行业涉及人工智能、高性能计算、数据中心基础设施、光通信、机器人及自动驾驶[1][2][10] * 公司为英伟达（NVIDIA），其发布了新一代AI芯片、交换机和AI模型及应用[1][2][9] 核心观点与论据算力硬件升级 * 发布Blackwell Ultra NVLink 72（GB300）方案，带宽是前代GB200的两倍，计划于2024年下半年出货[2] * 发布Rubin架构芯片，其中VR Ruby（NVLink 144版本）计划于2026年下半年出货，性能是GB300 NVLink 72的3.3倍，推理速度比当前Blackwell芯片高一倍多，支持高达288GB快速内存[3] * 发布Rubin Ultra（NVLink 576版本），性能是GB300 NVLink 72的14倍，支持CX9网卡且带宽达115.2T，采用288张卡在一个机柜内的新架构[3][4] * 算力密度提升推动PCB（用量增长）、电源和液冷需求增长，因新架构在机柜内集成更多芯片[5] 互联技术突破 * 发布两款CPU交换机：Quantum X系列（IB架构）计划2024年下半年出货，Spectrum X系列（以太网版本）计划2026年下半年出货[6] * Quantum X交换机总带宽为115.2T，由4个ASIC、每个ASIC搭载6个光引擎小单元（每个含3个光引擎）、共72个硅光引擎组成，每个光引擎带宽1.6T（单通道200G，八通道）[6][7] * 光引擎通过Socket连接器与交换机芯片连接，实现可插拔设计，降低维护成本并可能促进下游CSV厂商采用[8] AI应用与模型 * 推出AI推理软件Dynamo，在运行DeepSeek R1模型时，每个GPU生成的token数提高超过30倍，通过动态调整GPU资源和优化数据卸载提升效率[9] * 推出通用机器人基础模型N1，采用双系统架构（快速思考动作模型和慢速思考决策模型），支持抓取、移动物体等动作[10] * 推出端到端自动驾驶全栈安全系统HALOS，结合汽车硬件、软件和AI研究以确保安全[10] * 强调推理需求将大幅提升，因模型引入强化学习导致token数量增加，看好算力产业链（包括海外和国内）[11] 其他重要内容 * 架构变化：NVLink 576版本机柜布局分为四个部分，每个部分类似NVLink 72结构，使用Compute Blade和Switch Blade，中间通过PCB互联（材料特殊且用量增长）[4][5] * 行业影响：可插拔光引擎设计略超预期，可能加速CPU交换机 adoption[8] * 未来计划：GTC将持续发布更新信息[11]