Workflow
推理VLA技术
icon
搜索文档
物理AI的ChatGPT时刻!英伟达“内驱”无人驾驶汽车将至,发布首个链式思维推理VLA模型
美股IPO· 2026-01-05 23:38
英伟达发布开源推理VLA模型Alpamayo - 公司宣布开源其首个用于自动驾驶的推理VLA(视觉-语言-动作)模型Alpamayo 1,旨在打造能在意外情况下“思考”解决方案的车辆 [1] - 该模型采用100亿参数架构,使用视频输入生成轨迹和推理过程,展示每个决策背后的逻辑 [1][4] - 公司CEO黄仁勋表示,物理AI的ChatGPT时刻已到来,机器开始理解、推理并在真实世界中行动,无人出租车是首批受益者 [6] - 首款搭载英伟达技术的汽车将于第一季度在美国上路 [1][3] Alpamayo模型的技术定位与原理 - Alpamayo 1是业界首个为自动驾驶研究社区设计的思维链推理VLA模型,现已在Hugging Face平台发布 [4] - 该模型并非直接在车内运行,而是作为大规模教师模型,供开发者微调并提取到其完整自动驾驶技术栈的骨干中 [6] - 推理VLA模型将复杂的任务分解成可管理的子问题,并以可解释的形式阐明其推理过程,这使其能够更准确地解决问题 [8] - 构建推理VLA模型需要三种基本AI功能:视觉感知、语言理解以及动作和决策制定 [8] 完整的开源生态系统 - Alpamayo家族整合了三大基础支柱:开源模型、仿真框架和数据集,构建了一个完整的开放生态系统 [4] - AlpaSim是一个完全开源的端到端仿真框架,用于高保真自动驾驶开发,现已在GitHub平台发布 [9] - 公司提供了面向自动驾驶的大规模开放数据集,包含超过1700小时的驾驶数据,覆盖罕见且复杂的真实世界边缘案例 [9] - 这些工具共同为基于推理的自动驾驶技术栈创建了一个自我强化的开发循环 [10] 行业支持与合作 - 包括捷豹路虎、Lucid、Uber以及加州大学伯克利分校DeepDrive产业联盟在内的多家移动出行领军企业和研究机构表示将利用Alpamayo开发技术 [3] - 行业合作伙伴认为,开放、透明的AI开发对于负责任地推进自动移动出行至关重要,开源模型有助于加速整个生态系统的创新 [11] - 处理长尾和不可预测的驾驶场景是自动驾驶的决定性挑战之一,Alpamayo为行业创造了加速物理AI、提高透明度并增加安全L4级部署的新机遇 [11] 跨行业AI模型全面开放 - 除Alpamayo外,公司还发布了多个推动各行业AI发展的新开源模型、数据和工具 [12] - 这些模型涵盖用于代理AI的Nemotron家族、用于物理AI的Cosmos平台、用于机器人的Isaac GR00T以及用于生物医学的Clara [1][14] - 公司提供了全球最大的开放多模态数据集合之一,包括10万亿语言训练标记、50万个机器人轨迹、45.5万个蛋白质结构和100TB的车辆传感器数据 [14] - 博世、CrowdStrike、Salesforce、ServiceNow、日立和Uber等科技业领头羊正在采用并基于这些开源模型技术进行开发 [15]
物理AI的ChatGPT时刻!英伟达“内驱”无人驾驶汽车将至,发布首个链式思维推理VLA模型
新浪财经· 2026-01-05 23:14
来源:华尔街见闻 英伟达在无人驾驶领域迈出关键一步,宣布开源其首个推理 VLA (视觉-语言-动作) 模型Alpamayo 1,这一举措旨在加速安全的自动驾驶技术开发。该模型通过类人思维方式处理复杂驾驶场景,为解决 自动驾驶长尾问题提供新路径。 美东时间1月5日周一,英伟达CEO黄仁勋在拉斯维加斯举行的CES展会上发布了Alpamayo平台,使汽车 能够在真实世界中进行"推理"。黄仁勋表示,首款搭载英伟达技术的汽车将于第一季度在美国上路。 英伟达免费开放Alpamayo模型,允许潜在用户自行对模型进行重新训练。该模型旨在打造能在意外情 况下"思考"解决方案的车辆,例如交通信号灯故障等场景。车载计算机将分析来自摄像头和其他传感器 的输入,将其分解为步骤并提出解决方案。 这一开源举措获得了行业广泛支持。包括捷豹路虎(JLR)、Lucid、Uber以及加州大学伯克利分校 DeepDrive深度学习自动驾驶产业联盟(BDD)在内,多家移动出行领军企业和研究机构表示,将利用 Alpamayo开发基于推理的自动驾驶技术栈,推动L4级自动驾驶部署。 首个开源推理VLA模型发布 英伟达此次发布的Alpamayo家族整合了三大 ...