VLA模型技术
搜索文档
元戎启行即将上线Robotaxi,率先落地深圳和无锡
新浪财经· 2025-11-22 05:23
公司业务进展与规模 - 公司已交付20万辆搭载城市NOA(领航辅助驾驶)的量产车型,涉及10款车型 [2] - 2025年10月,公司在辅助驾驶城市NOA第三方供应商市场的单月市占率接近40% [2] - 公司月交付量从2025年初约3000台增长至年底约30000台,9月、10月均达到3万台 [2] - 按照规划,2026年公司量产交付将突破百万规模 [6] - 截至2025年10月,公司基于新一代辅助驾驶平台DeepRoute IO 2.0已达成5个定点合作项目 [7] 市场策略与客户合作 - 公司技术策略为率先布局无图技术,客户策略为深度绑定核心客户及核心车型,聚焦打造爆款而非广撒网式合作 [2] - 合作爆款车型案例:魏牌蓝山、坦克500近一年累计销量跻身细分市场前十,合计超10万辆;魏牌高山在搭载公司技术后,10月登顶新能源MPV销量榜首,达9928辆 [3] - 公司近期拿下一家国内头部新能源主机厂的全系辅助驾驶标配项目,该客户的SUV车型是中型SUV市场销冠 [3] - 公司CEO认为,现有客户已足以支撑2026年百万辆的交付目标 [6] 技术与产品优势 - 公司是第一家提供VLA(Vision-Language-Action)模型的第三方供应商,8月发布了搭载VLA模型的新一代辅助驾驶平台DeepRoute IO 2.0 [7] - VLA模型优势在于通过强化学习不断进化,具备对自然语言的理解与生成能力,使系统能输出行为解释,并具备COT(思维链)能力 [7] - VLA模型在深层场景理解与防御性驾驶能力上领先,尤其在处理遮挡场景方面表现优于传统端到端模型 [8] - 公司技术路径从多传感器前融合、无高精地图的Mapfree,演进至目前的端到端VLA架构 [7] Robotaxi业务规划 - 2026年是公司Robotaxi业务起飞的关键年份,预计年底前以消费级量产车落地Robotaxi [11] - 公司采用“渐进式”路径,目标成为全国首家以消费级量产车开展Robotaxi业务的企业 [11] - 公司已与无锡市政府达成战略协议,计划在无锡建设测试研发基地并落地Robotaxi业务,无锡和深圳有望率先部署 [11] - 公司基于量产程序、采用端到端技术完成了Robotaxi的牌照考试,新牌照意味着更强的无图化、泛化能力 [13] - 公司Robotaxi的三大优势:基于量产车使整车成本可控、基于海量数据飞轮训练模型、采用无图方案可在全国范围行驶 [14] 行业市场与竞争格局 - 辅助驾驶市场规模从2024年的62.5亿元增长至2025年的192.8亿元,预计2030年将达到603.3亿元 [6] - 2024年国内L2级及以上辅助驾驶乘用车渗透率达55.7%,预计2025年将提升至65% [6] - 行业竞争正快速收敛,传统L2方案如Mobileye逐渐被淘汰,城市NOA等高阶产品崛起 [6] - 公司CEO认为,明年竞争关键一是降低成本,二是提升体验,公司已针对不同需求准备了不同芯片方案和VLA技术 [6]
世界模型有望带来机器人与具身智能的下一个“奇点时刻”?
机器人大讲堂· 2025-11-09 15:30
世界模型的技术内核 - 世界模型是通过对真实世界的高维认知建模,赋予智能体理解、预测和规划能力的生成式AI框架[2] - 具备空间内化特性,通过3D高斯表征、点云等技术将二维感知数据转化为三维语义空间,精准还原环境的几何结构与空间关系[3] - 具备规律内化特性,学习物理世界的基本规则如物体运动轨迹、碰撞逻辑、交通流规律等,形成可复用的知识体系[3] - 具备时序内化特性,通过长时序记忆机制整合历史数据与实时信息,实现对动态场景的连续理解与趋势预测[3] - 与VLA模型的核心差异在于绕开语言中间层,直接通过空间感知数据进行物理规律推演[6] 世界模型的发展历程 - 思想最早可追溯至1990年Richard S Sutton提出的Dyna算法,首次实现学习-规划-反应的一体化机制[7] - 2018年David Ha与Jürgen Schmidhuber发布《World Models》论文,标志世界模型正式进入深度学习阶段[7] - 2019年以来进入加速发展期,DeepMind推出MuZero算法,LeCun提出JEPA模型,形成编码器-内部世界模拟器-策略决策器的完整架构[9] - 特斯拉率先将世界模型理念融入FSD系统,通过对场景的连续建模减少对高精地图的依赖[10] - 截至2025年6月,我国智能驾驶及相关机器人领域注册企业总数已超过7000家,其中近60%的头部企业已布局世界模型技术[10] 世界模型对机器人行业的影响 - 打破数据荒的行业瓶颈,通过少量真实数据种子生成海量虚拟场景,实现训练成本指数级下降[12] - 实现训练场景的大规模可能性,将测试场景扩展至2000余种,实现从样本测试到全场景验证的跨越[13] - 赋予机器人类人决策能力,通过感知-理解-生成的闭环能力在内部世界预判未来动态[15] - 提升时空一致性,通过高精度图像渲染与多模态时空对齐技术破解仿真-现实鸿沟[15] 世界模型产业化面临的挑战 - 长时序任务处理存在记忆衰减和信息断裂问题,影响决策连贯性和安全性[16] - 仿真与现实的本质差异在物品纹理、动态一致性、多模态干扰等方面仍存在[16] - 决策逻辑呈现黑盒化特征,需要建立可解释、可追溯的决策链路和行业标准[18] 世界模型与机器人行业的未来趋势 - 与VLA、VLM等多模态技术深度耦合,实现语义、感知和决策的无缝衔接[19] - 算法与算力提升将推动形成以世界模型为核心的端到端闭环解决方案[19] - 算力架构从单一端侧算力堆叠向云端-端侧协同演进,形成高效协同的算力体系[21] - 部署在边缘端的MoE与模型蒸馏技术将成为主流,通过激活部分专家网络降低计算负荷[21] - 到2030年,全球搭载世界模型的机器人市场规模将突破3万亿元,其中智能驾驶机器人占比达到60%[22]