理想汽车推出首款“穿戴机器人” 三个维度推进“具身智能”建设
中国金融信息网·2025-12-17 10:26

公司战略定位与愿景 - 理想汽车董事长兼CEO李想提出将公司打造成一家“具身智能企业”的愿景,并已迈出实质性一步,例如推出AI眼镜Livis [1] - 公司明确不做电动车或智能终端,而是定位为“具身智能”企业,以避免陷入参数大战或功能重复建设的竞争逻辑 [1] - 公司认为汽车是具身智能产品的核心形态之一,通过赋予其感知、模型、操作系统、算力、本体等能力,使其成为汽车机器人,实现从被动服务到自动和主动服务的转变 [2] 产品与技术维度建设 - 公司在产品、技术、组织三个维度推进“具身智能”建设 [1] - 技术层面坚持“深度自研,构建AI系统”,该系统包含感知、模型、操作系统、算力、本体 [2] - 感知技术方面,计划将3D BEV、OCC占用网络、2D ViT升级为与人眼工作原理相似的3D ViT,预计有效感知距离可扩大2-3倍,并能解决50%以上的辅助驾驶常见问题 [2] - 模型技术方面,3D ViT有助于VLA大模型更好地感知和理解物理世界,提升训练数据效率,解决辅助驾驶舒适性、反应迟钝等问题 [3] - 本体技术方面,通过线控体系将辅助驾驶从感知到执行的响应速度从550毫秒左右提升至350毫秒,预计可将事故率下降50%以上 [3] - 由于无第三方供应商可完整提供AI系统,公司全面自研并持续加大研发投入,已自研星环OS操作系统、基座模型等技术底座,计划2026年开始交付以自研M100芯片为核心的AI系统 [3] 组织架构调整 - 为适应具身智能新赛道,公司管理模式从2024年第四季度开始重新回归创业公司模式,以追求组织更加敏捷高效并充满活力 [4] - 回归创业公司模式明确了四项具体举措:更多深度对话而非汇报、聚焦用户价值而非交付、持续提升效率而非占有资源、识别关键问题而非创造信息不对称 [5] VLA大模型的核心能力 - 理想汽车是全球首个基于VLA大模型的辅助驾驶汽车制造公司,VLA大模型是构建AI系统、打造具身智能产品的关键路径 [6] - VLA大模型呈现五大核心能力:空间理解能力、思维与推理能力、沟通与记忆能力、行为能力、迭代能力 [6][7] - 空间理解能力提升模型对空间理解的精度,能感知远距空间并理解全局语义和交通意图 [6] - 思维与推理能力基于思维链,能通过对环境的理解和感知生成驾驶决策,并可进行实时推理,保持10Hz以上的帧率 [6] - 沟通与记忆能力允许驾驶员用自然语言与车辆交互,并记忆驾驶偏好,在园区行驶中实现分段记忆与使用 [7] - 行为能力通过强大的Diffusion扩散模型生成拟人化、丝滑的驾驶轨迹 [7] - 迭代能力基于强化学习及3D ViT加持的世界模型,提升了生成数据仿真迭代的效率,实现快速迭代 [7] - 五大核心能力最终带给用户的体验是安全、舒适、高超的驾驶技巧和自然的交互能力 [7] 自动驾驶发展前景 - 公司自动驾驶研发高级副总裁郎咸朋认为,从技术层面看,VLA模型可以走向更高级别的自动驾驶,但目前处于起步阶段,VLA模型约等于端到端的上限 [8] - VLA模型的迭代速度预计会非常快,但前提是需要完备的基础能力(算法、算力、数据)和工程能力支撑,并且需要更多成熟的仿真环境进行强化学习训练 [8] - 商业变现的核心影响因素是国家法律政策,公司正积极参与相关政策法规的讨论,技术上L4级别自动驾驶落地可能很快,但商业上仍需考虑保险、事故赔偿等问题 [8]