文章核心观点 - 由香港大学OpenDriveLab、中科院自动化所、小米汽车联合团队提出的SimScale方案,通过真实世界仿真生成关键场景与协同训练策略,为解决自动驾驶数据瓶颈提供了新路径[1][2] - 该方案的核心在于揭示了自动驾驶仿真数据的规模效应,证明无需增加真实数据,仅通过扩大仿真数量即可持续提升各类端到端驾驶模型的性能上限[3][39][40] 自动驾驶数据瓶颈与SimScale的提出 - 当前自动驾驶面临数据瓶颈,现实世界难以提供足够的关键与长尾场景,采集的数据多为价值有限的常态片段,导致数据越多、性能提升越难[5] - 行业瓶颈不在于数据规模,而在于缺乏能系统生成关键场景并支撑大规模训练的新方法[6] - SimScale应运而生,旨在通过“无限扩张世界”的仿真生成框架和虚实协同训练策略,突破上述瓶颈[7] SimScale系统架构与核心功能 - SimScale是一个可扩展的仿真生成框架,通过高保真神经渲染自动制造多样化的反应式交通场景与伪专家示范[8] - 它也是一套让仿真与真实数据“相互增益”的训练策略,能全面提升端到端模型的鲁棒性与泛化性[9] - 该系统首次系统揭示了自动驾驶仿真数据的规模效益,并提供了实践手册[10] 可扩展仿真生成框架的技术细节 - 框架采用“干扰-规划”策略实现规模化数据生成,需要同时包含合成图像和专家示范轨迹以有效训练模型[12] - 高保真神经渲染引擎基于3D高斯泼溅重建真实场景资产,能渲染多视角RGB视频,并分别建模背景与动态车辆以保留真实细节[14][15] - 通过轨迹扰动与状态探索,在真实轨迹上施加合理扰动,生成现实中难以遇见的关键场景(如偏离车道、逼近障碍物),系统性扩展策略的可见状态空间[17] - 设计了两类互补的伪专家策略为模型提供监督:基于恢复的策略(偏保守,提供安全底线示范)和基于规划的策略(更灵活,探索性强)[20][21] - 引入了反馈式多样场景模拟,使周围交通参与者具备反应能力,从而生成更接近真实驾驶的可扩展场景分布[23][24] 虚实互补的协同训练策略 - SimScale提供了一套仿真-真实数据协同训练策略,使模型既能保留真实驾驶分布,又能避免仿真瑕疵导致的性能下降[25] - 该策略可适用于各类端到端规划模型,包括回归型、扩散型及轨迹评分型规划器[26] - 对于依赖专家示范的规划器,仿真伪专家轨迹可提供可靠监督;对于奖励驱动的规划器,仿真数据可直接用于优化策略,实现利用效率最大化[26] - 实际应用中,仿真专门生成四类易触发模型失效的关键场景:偏离车道、近距离失碰、车道脱出与加塞切入,以帮助模型学习纠偏与避险能力[26] 模型性能提升的实验验证 - 在评估模型在未见极端场景下应对能力的navhard基准测试中,所有类型端到端规划器的性能均有大幅增强,最多可提升6.8 EPDMS,其中基础性能较弱的规划器性能提升超过20%[29][30] - 在评估模型在多样化挑战性场景下可靠性的navtest基准测试中,所有类型规划器的性能也有明显增强,最多可提升2.9 EPDMS[30][31] - 通过对轨迹评分规划器进行多专家集成,SimScale在NAVSIMv2官方排行榜上取得了第一名的成绩[31][33] 仿真数据的规模效应核心发现 - SimScale首次系统揭示了仿真数据对端到端规划模型性能的规模效应,通过建模总数据量与模型表现的关系,展示了在真实数据固定时,增加仿真数据能持续提升模型表现[34] - 核心发现一:探索型伪专家(规划型)比恢复型伪专家更为高效,因其能探索更广状态空间,生成更多可行解,从而充分发挥仿真数据价值[36] - 核心发现二:多模态建模(如扩散型模型)能更好地捕捉行为多样性,随仿真数据增加表现持续提升,激发了数据扩展能力[36] - 核心发现三:对于评分型规划器,仅使用奖励信号即可在仿真中取得优异表现,无需伪专家轨迹,说明奖励引导能充分发挥仿真数据价值[36] - 进一步实验表明,无论真实数据规模大小,仿真数据带来的性能提升始终显著且稳定,没有出现“收益饱和”现象,表明SimScale能在不同数据规模下持续放大系统性能[38][39]
仿真数据也能Scaling!虚实结合训练,端到端性能全面提升|中科院x港大x小米汽车
量子位·2025-12-11 01:33