Workflow
NVIDIA Alpamayo
icon
搜索文档
老黄All in物理AI!最新GPU性能5倍提升,还砸掉了智驾门槛
量子位· 2026-01-06 01:01
下一代Rubin架构GPU 推 理、训练性能分 别是 Blackwell GB 200的5倍和3.5倍 (NVFP4数据格式)。 西风 闻乐 发自 凹非寺 量子位 | 公众号 QbitAI 刚刚,英伟达CEO黄仁勋穿着鳄鱼皮夹克,在全球最大消费电子展 CES 2026 上发布AI新品。 这是五年来,英伟达首次来到CES却没有发游戏显卡,态度很明确: 全力 搞AI。 全力搞出来的结果也让围观群众直呼:竞争对手如何追上英伟达? 除此之外,老黄还带来了五大领域的全新发布,包括: 面向Agentic AI的 NVIDIA Nemotron 模型家族 面向物理AI的 NVIDIA Cosmos 平台 同时,英伟达宣布持续向社区 开 源训 练框架 以 及 多模 态数据 集 。其中数据集包括10万亿语言训练token、50万条机器人轨迹数据、 45.5万个蛋白质结构、100TB车辆传感器数据。 这次的核心主题,直指 物理AI 。 面向自动驾驶开发的全新 NVIDIA Alpamayo 模型家族 面向机器人领域的 NVIDIA Isaac GR00T 面向生物医学的 NVIDIA Clara 用网友的话来说: 这是英伟达将护 ...
NVIDIA Announces Alpamayo Family of Open-Source AI Models and Tools to Accelerate Safe, Reasoning-Based Autonomous Vehicle Development
Globenewswire· 2026-01-05 21:49
文章核心观点 - NVIDIA在CES 2026上发布了名为Alpamayo的开放式AI模型、仿真工具和数据集家族,旨在加速下一代基于推理的安全自动驾驶汽车发展 [1][4][12] - Alpamayo家族通过引入基于思维链的视觉语言行动模型,为自动驾驶决策带来类人推理能力,旨在解决罕见、复杂的“长尾”驾驶场景挑战 [2][3][12] - 该生态系统整合了开放模型、仿真框架和数据集三大支柱,为汽车开发商和研究团队提供了一个可构建的完整、开放生态系统 [4][10][11] 产品与技术细节 - **Alpamayo 1模型**:行业首个基于思维链推理的视觉语言行动模型,拥有100亿参数架构,使用视频输入生成轨迹和推理痕迹,展示每个决策背后的逻辑 [13] - **AlpaSim仿真框架**:一个完全开源、端到端的高保真自动驾驶开发仿真框架,提供真实的传感器建模、可配置的交通动态和可扩展的闭环测试环境 [13] - **Physical AI开放数据集**:包含超过1,700小时的驾驶数据,覆盖了最广泛的地理区域和条件,包含对推进推理架构至关重要的罕见复杂真实世界边缘案例 [13] - 这些模型并非直接在车载系统运行,而是作为大规模教师模型,供开发者微调并提炼到其完整自动驾驶技术栈的骨干中 [5] - 未来该家族的模型将具有更大的参数量、更详细的推理能力、更灵活的输入输出选项以及商业用途选择 [13] 行业影响与合作伙伴 - 移动出行领军企业和行业专家,包括Lucid、JLR、Uber和Berkeley DeepDrive,均对Alpamayo表现出兴趣,以开发能够实现L4级自动驾驶的基于推理的自动驾驶技术栈 [8][12] - 行业观点认为,向物理AI的转变凸显了对能够推理现实世界行为的AI系统日益增长的需求,而先进的仿真环境、丰富的数据集和推理模型是发展的重要元素 [9] - 该模型的开放源码性质加速了全行业的创新,使合作伙伴能够根据其独特需求调整和完善该技术 [9] - 借助Alpamayo,行业领导者和研究社区可以加快安全、基于推理的L4级部署路线图 [12] 开发与部署支持 - 开发者可以利用NVIDIA丰富的工具和模型库,包括来自NVIDIA Cosmos和NVIDIA Omniverse平台的工具 [9] - 开发者可以在专有车队数据上微调模型版本,将其集成到基于NVIDIA DRIVE AGX Thor加速计算构建的NVIDIA DRIVE Hyperion架构中,并在商业部署前在仿真中验证性能 [9] - 这些工具共同为基于推理的自动驾驶技术栈实现了一个自我强化的开发循环 [7]
NVIDIA (NasdaqGS:NVDA) 2026 Earnings Call Presentation
2026-01-05 21:00
业绩总结 - Hugging Face的月下载量在2023年达到了160百万次[9] - NVIDIA的Rubin GPU的推理性能达到3.6 EFLOPS,训练性能为2.5 EFLOPS[134] - NVIDIA的AI计算需求激增,预计每年令令牌数量增长5倍[113] 用户数据 - 80%的初创公司正在基于开放模型进行构建[10] - 在开放模型中,Owen2-VL-7B在文本识别、文本引用和文本定位的准确率分别为72.1%、47.9%和17.5%[20] 新产品和新技术研发 - 预计到2025年,生成和处理数据的能力将显著提升,推动市场趋势[10] - 公司在2025年将推出全栈自动驾驶平台,搭载在梅赛德斯-奔驰CLA车型上[68] - 预计将发布的语言模型包括Kimi K2和DeepSeek V3.2等[8] - 新推出的六款芯片标志着技术的重大进步[144][147] 市场扩张和并购 - NVIDIA在开放模型生态系统中处于领先地位,推动了多模型和多云的应用[14] - 新平台支持每秒处理5倍更多的tokens,且能实现5倍的能效提升[142] 负面信息 - 在开放模型中,Cosmos-Reason1-78在IntPhys、MVPBench和CausalVQA的准确率分别为59.88%、41.31%和48.17%[18] 其他新策略和有价值的信息 - NVIDIA的Vera CPU具有1.8 TB/s的NVLink-C2C带宽和1.5 TB的系统内存,支持176线程[120] - NVIDIA的HBM4带宽达到1.6 PB/s,较之前提升了2.8倍[134] - NVIDIA的Spectrum-X以102.4 Tb/s的规模扩展交换基础设施,支持128个800 Gb/s端口[136] - NVIDIA的BlueField-4 DPU提供800G Gb/s的网络处理能力,具有64核Grace CPU[127] - NVIDIA的ConnectX-9支持800 Gb/s以太网,具备23亿个晶体管[125] - NVIDIA的NVFP4训练性能为35 PFLOPS,较之前提升了3.5倍[122] - NVIDIA的Vera Rubin GPU拥有3360亿个晶体管,较之前提升了1.6倍[122] - 训练时间减少至原来的四分之一,所需GPU数量减少[148] - 工厂的token产出能力提高至原来的10倍[150] - Token成本降低至原来的十分之一[151] - 预计一个月内可处理100万亿tokens[149] - 提供一个适用于所有AI的统一平台,包括Vera Rubin和Open Models[152]