自动紧急制动(AEB)
搜索文档
任少卿的智驾非共识:世界模型、长时序智能体与 “变态” 工程主义
自动驾驶之心· 2025-10-11 16:03
公司技术路线与架构选择 - 公司选择了一条高算力、多传感器、全新架构(世界模型加强化学习)的技术组合,被内部形容为“变态”的困难路径[8][9] - 该技术路线旨在建立一套真正接近物理世界的能力栈,虽然意味着更重的训练和更长的周期,但被认为是通向未来的道路[9][10] - 公司是国内第一个提出世界模型概念的厂商,其核心是以视频为底座,建立高带宽的时空认知能力,而非在语言模型上做模态扩展[21][26][27] - 公司认为端到端是智能驾驶历史阶段的产物,是“填坑”行为,而公司的目标是超越端到端,探索世界模型和强化学习等更根本的AGI路径[16][60][66] - 公司在2022年3月实现基于英伟达OrinX芯片的全栈自研平台Banyan量产,并在2024年5月推送了世界模型NWM的OTA更新[42][100] 世界模型技术解析 - 世界模型被定义为包含两个层面:物理规律的内建(如重力、惯性)和时空操作能力(理解预测物体在三维空间加时间维度的运动)[23] - 世界模型与语言模型是并行关系,前者解决“认知时空和规律”,后者解决“认知语言和概念”,两者融合才能形成真正的AGI[25] - 世界模型的核心优势在于建立高带宽的时空认知,类比脑机接口,旨在用图像直接交互,摆脱低带宽语言描述的限制[26][27] - 与世界模型相比,VLA(视觉-语言-动作)本质仍是语言模型的模态扩展,其“根”在语言上,视觉是“外挂”的转换器[25][29][30] - 训练世界模型需要大量视频数据,来源主要包括游戏引擎生成的数据和真实世界的车载传感器数据[54] 数据策略与强化学习应用 - 公司建立了三层递进的数据系统:数据闭环系统(DLB)、伴生测试系统、风险评估控制系统(RAMS),形成了业界顶尖的数据处理能力[74][76][77] - 数据策略上,公司倾向于使用“脏”但量大的量产数据,而非干净但量小的专家数据,认为通过强化学习清洗数据能学到更复杂的真实世界情况[55][57][59] - 强化学习被赋予两个关键作用:能“洗数据”,将模型输出的好的分布往前排;能延长“上下文”,让模型学会处理长时序推理,摆脱“5秒记忆的金鱼”状态[60][75] - 公司认为行业至今没有完全接受强化学习的重要性,而公司已在内部实验并计划在年底新版本中推出基于强化学习的长时序能力[60][64] - 通过端到端AEB模型和伴生测试体系,公司将AEB的真实场景响应率从不到10%提升至70%-80%,并获保险公司数据验证事故损失下降25%[86][88] 工程体系与研发管理 - 公司研发组织采用“4×100米接力棒”模式,明确划分为预研、量产、平台复制、车型复制四个阶段,职责清晰以提升效率[95][97][105] - 公司拥有三代智驾平台量产经验(Aspen, Banyan, Cedar),且均为对应芯片(Mobileye EyeQ4, 英伟达OrinX, 自研神玑)的全球首个量产平台,工程能力被极致锻炼[100][101] - 在工程上,公司自建了CUDA之上的软件栈(cuDNN、框架层、工具层),为自研芯片对接和快速量产打下基础,此做法在行业中非常独特[103] - 平台策略上,高算力平台(4颗Orin)提供安全冗余、新功能先发和更早迭代的优势,再通过技术蒸馏迁移到低算力平台(如乐道的1颗Orin)[92][93] - 公司强调技术追求简单高效,认为复杂高效不可持续,目标是建立“又新又轻松”的架构,用更少资源达到更好效果,提升竞争力上限[113][115] 产品进展与未来目标 - 公司在2025年5月于地库场景首发了语言交互找出口功能,为国内首个量产的此类功能,并计划在年底到明年Q1逐步推出开放集指令交互(Open-set)[39][40] - 公司将主动安全(如AEB)置于最高优先级,目标是切实减少事故,最新目标是力争在年内将事故损失降低50%[86][118] - 公司认为当前技术体系可以通往L3、L4,明年智驾竞争将更明显地向L3/L4迈进,技术端的关键是搞定世界模型的长时序能力[108][109] - 公司智驾研发的终极目标并非单纯实现L3功能,而是让系统更像人,能处理人所处理的各类长短时序决策,核心价值在于解放精力和减少事故[107][117] - 公司通过统一架构处理高速和城区场景,虽然初期开发量大、节奏显慢,但避免了方案割裂,旨在获得更干净、更具扩展性的长远优势[51][84]