理想汽车推出首款“穿戴机器人” 三个维度推进“具身智能”建设

公司战略定位与愿景 - 理想汽车董事长兼CEO李想提出将公司打造成一家“具身智能企业”的愿景，并已迈出实质性一步，例如推出AI眼镜Livis [1] - 公司明确不做电动车或智能终端，而是定位为“具身智能”企业，以避免陷入参数大战或功能重复建设的竞争逻辑 [1] - 公司认为汽车是具身智能产品的核心形态之一，通过赋予其感知、模型、操作系统、算力、本体等能力，使其成为汽车机器人，实现从被动服务到自动和主动服务的转变 [2] 产品与技术维度建设 - 公司在产品、技术、组织三个维度推进“具身智能”建设 [1] - 技术层面坚持“深度自研，构建AI系统”，该系统包含感知、模型、操作系统、算力、本体 [2] - 感知技术方面，计划将3D BEV、OCC占用网络、2D ViT升级为与人眼工作原理相似的3D ViT，预计有效感知距离可扩大2-3倍，并能解决50%以上的辅助驾驶常见问题 [2] - 模型技术方面，3D ViT有助于VLA大模型更好地感知和理解物理世界，提升训练数据效率，解决辅助驾驶舒适性、反应迟钝等问题 [3] - 本体技术方面，通过线控体系将辅助驾驶从感知到执行的响应速度从550毫秒左右提升至350毫秒，预计可将事故率下降50%以上 [3] - 由于无第三方供应商可完整提供AI系统，公司全面自研并持续加大研发投入，已自研星环OS操作系统、基座模型等技术底座，计划2026年开始交付以自研M100芯片为核心的AI系统 [3] 组织架构调整 - 为适应具身智能新赛道，公司管理模式从2024年第四季度开始重新回归创业公司模式，以追求组织更加敏捷高效并充满活力 [4] - 回归创业公司模式明确了四项具体举措：更多深度对话而非汇报、聚焦用户价值而非交付、持续提升效率而非占有资源、识别关键问题而非创造信息不对称 [5] VLA大模型的核心能力 - 理想汽车是全球首个基于VLA大模型的辅助驾驶汽车制造公司，VLA大模型是构建AI系统、打造具身智能产品的关键路径 [6] - VLA大模型呈现五大核心能力：空间理解能力、思维与推理能力、沟通与记忆能力、行为能力、迭代能力 [6][7] - 空间理解能力提升模型对空间理解的精度，能感知远距空间并理解全局语义和交通意图 [6] - 思维与推理能力基于思维链，能通过对环境的理解和感知生成驾驶决策，并可进行实时推理，保持10Hz以上的帧率 [6] - 沟通与记忆能力允许驾驶员用自然语言与车辆交互，并记忆驾驶偏好，在园区行驶中实现分段记忆与使用 [7] - 行为能力通过强大的Diffusion扩散模型生成拟人化、丝滑的驾驶轨迹 [7] - 迭代能力基于强化学习及3D ViT加持的世界模型，提升了生成数据仿真迭代的效率，实现快速迭代 [7] - 五大核心能力最终带给用户的体验是安全、舒适、高超的驾驶技巧和自然的交互能力 [7] 自动驾驶发展前景 - 公司自动驾驶研发高级副总裁郎咸朋认为，从技术层面看，VLA模型可以走向更高级别的自动驾驶，但目前处于起步阶段，VLA模型约等于端到端的上限 [8] - VLA模型的迭代速度预计会非常快，但前提是需要完备的基础能力（算法、算力、数据）和工程能力支撑，并且需要更多成熟的仿真环境进行强化学习训练 [8] - 商业变现的核心影响因素是国家法律政策，公司正积极参与相关政策法规的讨论，技术上L4级别自动驾驶落地可能很快，但商业上仍需考虑保险、事故赔偿等问题 [8]