REALM:机器人操作任务的real2sim验证基准
具身智能之心·2025-12-27 10:03

点击下方 卡片 ,关注" 具身智能 之心 "公众号 作者丨 Jai Bardhan等 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 核心背景与问题 Vision-Language-Action(VLA)模型让机器人能够理解自然语言指令并执行操纵任务,但泛化能力评估一直是关键挑战——真实世界评估成本高、可重复性差,而 现有仿真基准存在明显缺陷:扰动类型有限、缺乏高保真视觉效果和真实的机器人控制对齐,导致仿真与真实世界性能脱节(即"现实-仿真差距")。 为解决这一问题, 捷克理工大学,阿姆斯特丹大学的研究团队 构建了REALM:一个高保真仿真环境与基准,核心目标是建立仿真与真实世界性能的强相关性,实现 大规模、低成本的VLA模型泛化能力评估。其核心突破在于三点:高保真视觉与控制对齐的仿真环境、覆盖多维度扰动的系统评估方案、经实证验证的真实-仿真 性能关联性。 相关工作与差异化优势 现有机器人操纵泛化基准多依赖仿真,但存在显著局限:GemBench、 ...