Workflow
推理增强学习框架
icon
搜索文档
港中文最新!ReAL-AD:迈向类人推理的端到端自动驾驶,轨迹性能提升30%(ICCV'25)
自动驾驶之心· 2025-07-20 08:36
核心观点 - 提出ReAL-AD框架,通过三层人类认知模型(驾驶策略、驾驶决策、驾驶操作)实现类人推理的端到端自动驾驶 [2][8] - 集成视觉-语言模型(VLMs)增强环境感知和结构化推理能力,规划准确性和安全性提升超过30% [2][11][34] - 采用层次化轨迹解码器实现从粗到细的轨迹规划,L2误差减少33%,碰撞率降低32% [9][34] 技术架构 - **策略推理注入器**:解析VLM生成的交通情境见解,制定高层次驾驶策略 [8][17] - **驾驶推理整合器**:将战略意图细化为可解释的驾驶选择(如变道、超车、速度调整) [8][20] - **层次化轨迹解码器**:两阶段变分解码器,先建立粗略运动模式再细化轨迹 [24][26] 实验验证 - **数据集**:NuScenes(1,000个20秒场景)和Bench2Drive(13,638片段/200万帧) [30] - **开环指标**:平均L2误差0.48米(NuScenes)、0.84米(Bench2Drive),碰撞率0.15%/0.12% [34] - **闭环指标**:驾驶评分提升至41.17,成功率11.36%,优于基线模型UniAD/VAD [35] 行业对比 - **传统方法局限**:依赖固定稀疏轨迹监督,无法模拟人类分层决策过程 [3][7] - **现有VLM应用**:多作为辅助模块提供语义线索,缺乏与决策层次的有机整合 [5][12] - **创新点**:首次将VLM推理嵌入三层决策架构,实现战略-战术-操作的全链路协同 [8][11] 性能优化 - **消融实验**:移除战略推理注入器导致L2误差增加12%,碰撞率上升19% [36] - **解码器设计**:两层结构比单层L2误差降低0.14米,三层会引入过拟合 [39] - **损失函数**:相似性损失有效弥合文本特征与轨迹预测特征的模态差距 [38]