Workflow
机器人自主探索建图
icon
搜索文档
ICCV 2025 | 机器人自主探索未知复杂空间?GLEAM破解主动探索建图的泛化难题
机器之心· 2025-08-11 04:27
研究背景 - 机器人在陌生复杂场景中主动探索存在技术盲区,经典方案依赖人工预设轨迹和指令,现有策略在复杂环境中频繁失效[4][6] - 感知-决策-行动闭环的被动依赖问题成为下一代机器人跨越"智能鸿沟"的核心挑战[6] 解决方案 - 香港中文大学与上海人工智能实验室联合提出GLEAM系统,搭建全球最大"探索-建图"基准GLEAM-Bench,涵盖1152个室内场景[7][14] - GLEAM策略实现零样本适配未知复杂空间,无需微调即达66.5%平均场景覆盖率,较现有技术提升9.49%[7] 方法效果 - GLEAM在三个室内场景数据集上展现优越泛化能力,首次实现无需微调的零样本适配真实场景(如Matterport3D)[10] - 基线方法仅适用于单一空旷场景,GLEAM突破多房间障碍密集布局的探索安全性和高效性瓶颈[10] 数据与基准 - GLEAM-Bench包含混合数据集:Replica(18个合成场景)、HSSD(211个合成场景)、ProcTHOR-10K(10k合成场景)、Gibson(106个真实扫描)、Matterport3D(90个真实扫描)[16][17] - 数据集总规模达91.16k m²导航面积和164.66k m²地板面积,平均导航复杂度11.35[17] 技术创新 - 语义认知地图系统:双地图架构(全局概率地图+局部语义地图)实现高效时空推理[22] - 分层动作空间:解耦全局探索与局部避障,高层决策预测长程目标,低层规划验证可达性[23] - 抗过拟合训练:随机初始化位置+动态轮换千级训练场景,提升跨域适应能力[24][26] 实验结果 - 在ProcTHOR & HSSD测试集上达到76.01%覆盖率和66.13%AUC,建图精度0.38m;在Gibson & Matterport3D上达47.04%覆盖率和40.23%AUC[27] - 推理速度达104.7Hz(RTX 3090),其中策略推断耗时2.63ms,地图构建3.44ms[29][30] - 训练场景复杂度显著影响性能:192个多房间场景效果优于416个少房间场景[28]