OmniRetarget
搜索文档
“盲眼”机器人在完全看不见的情况下30秒跑酷首秀惊艳!
具身智能之心· 2025-10-07 03:03
文章核心观点 - 亚马逊机器人团队FAR发布首个名为OmniRetarget的人形机器人研究成果,该技术能在完全无视觉感知的情况下完成复杂任务[2][9] - OmniRetarget是一个开源数据生成引擎,通过交互网格方法将人类演示转化为高质量机器人运动参考,实现从仿真到硬件的零样本迁移[12][13] - 该技术在运动学质量和下游策略性能上全面领先现有基线方法,成功率领先10%以上[16][42] 技术原理与方法 - 核心技术是基于交互网格的动作重定向方法,通过建模机器人、物体和地形之间的空间和接触关系来保留必要交互[15] - 交互网格被定义为一个体积结构,通过德劳内四面体化构建,并最小化拉普拉斯形变能量来保持空间关系[19][21][22] - 采用顺序二次规划风格的迭代方法求解约束非凸优化问题,保证时间连续性和平滑性[23][24] - 通过参数化改变物体配置、形状或地形特征,将单个人类演示转化为丰富多样的数据集[28][32] 性能表现与实验结果 - 在机器人-物体交互任务中,OmniRetarget的下游强化学习策略成功率达到82.20% ± 9.74%,显著高于基线方法[41] - 在机器人-地形交互任务中,成功率进一步提升至94.73% ± 22.33%[41] - 在完整增强数据集上训练的成功率为79.1%,与仅使用标称动作的82.2%相近,表明增强方法能扩大动作覆盖范围而不显著降低性能[39] - 在运动学质量指标上,OmniRetarget在穿透、脚部打滑和接触保留方面整体优于所有基线方法[41] 团队背景与发展前景 - 研发团队Amazon FAR成立仅七个多月,由华人学者领衔,负责人Rocky Duan来自著名机器人技术公司Covariant[43][48] - 团队核心成员包括UC Berkeley的Pieter Abbeel等机器人领域知名学者[44][45] - 这是亚马逊在人形机器人(足式)领域的首次尝试,展示了公司在机器人技术方面的强大研发能力[49][50]
亚马逊“盲眼”机器人30秒跑酷首秀惊艳!华人学者领衔
量子位· 2025-10-06 05:42
核心技术:OmniRetarget方法 - 亚马逊机器人团队FAR发布首个足式人形机器人研究成果OmniRetarget,该技术使机器人在完全无摄像头、雷达等感知单元的情况下完成搬动9斤重椅子、攀爬1米高桌台等高难度动作[1][9] - OmniRetarget是一个开源数据生成引擎,通过交互网格建模机器人、物体和地形间的空间接触关系,将人类演示转化为高质量运动学参考,实现从仿真到人形机器人的零样本迁移[11][12][14] - 与PHC、GMR等基线方法相比,OmniRetarget在硬约束、物体交互、地形交互等关键指标上全面领先,尤其在防止脚部打滑(最大速度0 cm/s)和减少物体穿透(最大深度1.34cm)方面表现突出[15][40] 技术创新细节 - 交互网格通过德劳内四面体化构建,以拉普拉斯形变能最小化为优化目标,保留原始交互的空间结构和接触关系,适配不同机器人形态时仅需调整关键点对应关系[18][20][21][24] - 通过参数化改变物体配置、形状或地形特征,将单个人类演示转化为多样化数据集,完整增强数据集训练的成功率达79.1%,与标称动作的82.2%相近[27][38] - 强化学习策略仅依赖本体感知和参考轨迹,结合五类奖励(身体跟踪、动作速率等)和领域随机化,实现高保真动作跟踪且无需繁琐参数调整[29][30][33] 性能表现与行业影响 - 在30秒连续任务中,搭载OmniRetarget的宇树G1机器人完成多阶段跑酷动作,下游强化学习策略成功率在机器人-物体交互任务中达82.2%,在机器人-地形交互任务中达94.73%[37][38][40] - 该技术由成立仅七个多月的亚马逊FAR团队开发,团队核心成员来自知名机器人公司Covariant,由华人学者Rocky Duan领导,标志着亚马逊在足式人形机器人领域的首次突破[42][46][47][48]