Workflow
UniOcc
icon
搜索文档
ICCV 2025 | UniOcc: 自动驾驶占用预测与推理统一数据集及基准平台
机器之心· 2025-07-09 07:10
核心观点 - UniOcc是首个面向自动驾驶语义占用栅格构造或预测任务的统一基准框架,融合真实世界与仿真环境的多源数据,统一体素格式与语义标签,并首次引入体素级前后向运动流标注 [1] - UniOcc设计了多项免真值指标,用于衡量物体形状合理性与时序一致性,摆脱了伪标签评估限制 [1] - UniOcc支持多车协同占位预测与推理,推动自动驾驶迈向多模态、泛化能力更强的新阶段 [2] 背景与挑战 - 当前自动驾驶感知研究面临伪标签缺陷、数据割裂、动态信息缺失和多车协同感知缺乏四大挑战 [7][8][10] - 主流数据集缺乏真实占位标注,依赖LiDAR启发式生成的伪标签,仅覆盖可见表面,无法反映真实物体完整形状 [7] - 现有方法多局限于单一数据源,不同数据集间配置、采样率、格式、注释不统一 [8] - 当前三维占位标签通常不包含物体运动信息,模型无法利用运动线索进行预测 [8] - 之前缺乏多车协同占位预测的数据集 [10] 四项关键创新 - 多源数据统一处理:汇聚真实场景和仿真场景数据,统一格式并提供标准化预处理和加载Dataloader [12] - 体素级运动流标注:为每个三维体素标注前向和反向三维速度向量,全面记录物体平移与旋转 [13] - 免真值评估指标:提出免真值评估指标和工具,避免依赖伪标签进行评价 [14] - 支持协同预测能力:涵盖多车协同感知场景,支持多车传感器融合方法 [16] 实验验证 - 引入运动流信息后,OccWorld等3D占位预测模型在nuScenes和Waymo上的mIoU指标均有提高 [18] - 多源联合训练增强跨域泛化能力,在nuScenes和CARLA等多域数据上联合训练OccWorld,mIoU均优于单源训练 [19] - 在模拟多车场景中验证协同优势,CoHFF模型通过多车信息共享对Car类别的IoU达到87.22% [22] 开源与应用价值 - UniOcc支持单帧占位预测、多帧占位预测、多车协同预测和动态分割与跟踪等多种任务 [24] - 提供跨域数据格式、完整流注释、分割跟踪工具和免真值评估指标,简化研究者开发和对比工作 [25] - 为训练和评估多模态/语言模型奠定基础,推动语义占位预测技术发展 [25]