Workflow
理想汽车的VLA“长征”
经济观察报·2025-08-12 11:05

核心观点 - 理想汽车通过自研VLA司机大模型践行长期主义哲学,选择技术难度更高但壁垒更深的路径,而非行业普遍采用的"短平快"端到端方案 [2][4][7] - VLA模型通过强化学习实现机器理解驾驶逻辑的本质突破,目标是达到人类驾驶安全水平的10倍(600万公里/次事故)[9][16] - 公司构建了数据、算法、算力、工程四位一体的技术护城河,包括43亿公里辅助驾驶数据积累和4000万公里仿真测试里程 [18][19][26] - 市场验证显示智能驾驶已成为品牌核心竞争力,30万以上车型AD Max交付占比达75.4%-84.6%,试驾满意度92% [13][15] 技术路线选择 - 行业现状:端到端+VLM架构遭遇性能瓶颈,训练数据超1000万Clips后增长缓慢,实车测试无法覆盖极端场景 [6] - 理想批判:端到端模型被比喻为"猴子开车",仅模仿行为不具逻辑思维,短期技术≠真正智能 [7][20] - 战略转向:推翻现有架构自研VLA,通过强化学习实现"思维涌现",理解"为何这样做"而非"能做什么" [7][16][20] VLA技术优势 - 安全性能:当前辅助驾驶事故率350-400万公里/次,目标提升至600万公里/次(人类水平60万公里/次)[9] - 个性化体验:通过Face ID识别家庭成员自动切换驾驶风格,实现"车越开越像主人"的进化能力 [9] - 效率革命:仿真测试单日峰值30万公里,2025年上半年累计超4000万公里,成本仅为实车测试的10% [10][19] 技术攻坚细节 - 数据体系:累计43亿公里辅助驾驶里程,12亿公里有效回传数据,严格筛选"老司机数据"剔除25%不合规行为 [18] - 算法突破:采用CoT思维链实时显示决策逻辑,解决端到端"无脑执行"痛点;Diffusion推理步骤从10步压缩至2步 [20][24] - 算力优化:Thor芯片实现700TOPS有效算力,通过QAT量化训练将参数转为INT8/FP8;32B云端大模型蒸馏至3.2B车端模型 [24] - 工程能力:自研4B MoE混合专家架构,轨迹生成时延仅15毫秒,兼容Orin X和Thor芯片打破"芯片歧视链" [21][24][26] 市场验证与目标 - 用户数据:智能驾驶试驾率72.4%,满意度92%;30万/40万以上车型AD Max交付占比75.4%/84.6% [13] - 阶段目标:2025年底MPI接管里程达400-500km,2026年目标1000km以实现"VLA的ChatGPT时刻" [15] - 技术愿景:VLA架构将延续至机器人时代,比端到端更具长期潜力,符合人类智能发展规律 [34] 价值观与挑战 - 安全原则:即便走错路也不执行危险纠正动作,初期接受功能保守(如地库限速10km/h)换取安全冗余 [28][31][33] - 交互难题:需解决复杂指令的"通识门槛"和权责模糊问题,如闲聊可能误触发操控指令 [30] - 行业质疑:坚持安全优先、有效算力至上、用户共建迭代三大原则应对参数竞赛质疑 [34]