多家企业押注VLA背后:智驾路线要趋于融合?
每日经济新闻·2025-12-16 12:21

文章核心观点 - 智能驾驶行业在技术路线上出现分化,以理想汽车和小鹏汽车为代表的企业选择VLA(视觉语言动作模型)方案,而华为、蔚来等企业则布局世界模型方案,但两者并非对立,未来存在融合趋势 [1][2][4][5][6] 技术路线分歧 - 行业在辅助驾驶发展方向上出现VLA与世界模型的技术路线“分歧”,理想汽车与小鹏汽车是选择VLA方案的代表 [2] - 华为智能汽车解决方案BU CEO靳玉志表示不会走向VLA路径,认为其并非走向真正自动驾驶的路径,蔚来、商汤等企业也在世界模型技术路线上布局 [4][5] VLA(视觉语言动作模型)方案 - VLA被视为端到端方案的“智能增强版”,V代表视觉感知,A代表动作执行,L是大语言模型,L像“中台”把感知信息转译为规划与决策 [3] - VLA模型的核心突破在于引入思维链,通过语言模型实现对环境理解与决策推理的可解释性,并能摆脱传统端到端模型的黑盒难题,泛化能力更强 [3] - 理想汽车自动驾驶负责人郎咸朋认为VLA是自动驾驶最好的模型方案,关键在于模型要与整个具身智能系统适配,数据起决定作用,并称其拥有数百万辆车构建的数据闭环 [1][4] - 小鹏汽车董事长何小鹏宣布小鹏VLA 2.0将在下个季度发布,并与团队立下“赌约”:若2026年8月30日前其VLA系统在国内达到特斯拉FSD V14.2版本在硅谷的整体效果,他将在硅谷筹建食堂 [1] - 小鹏汽车发布了第二代VLA,方案从第一代的V到L再到A,变为V+L到A,把L转移到输入端,以避免信息损耗 [7] 世界模型方案 - “世界模型”指AI系统通过感知数据构建对物理世界的内部模拟,从而具备预测、推理和生成合理行为链的能力,在辅助驾驶中能理解世界并预测未来 [4][5] - 世界模型的高算力需求决定了它更适合在云端做数据生成和极度逼真的仿真测试和强化训练 [6] 技术融合趋势 - VLA与世界模型在技术上并非对立关系,而是产业玩家在实现端到端能力后,在能力优化侧重点上出现的分化 [6] - 双方技术融合趋势明显,均在向对方领域渗透,例如VLA引入强化学习与仿真优化动作生成 [6] - 理想汽车董事长李想提到,VLA的强化学习中最重要的一步就是在世界模型里闭环学习 [6] - 小马智行CTO楼天城表示大部分公司两种技术都用,世界模型和VLA模型不是同一维度的东西,而是交错的,不矛盾 [7] - 既向C端卖车又计划推出Robotaxi的小鹏汽车,有将两种技术融合的趋势 [7]