RAPID Hand
搜索文档
NeurIPS 25 | 中大&UC Merced等开源RAPID Hand,重新定义多指灵巧手数据采集
机器之心· 2025-10-14 08:24
研究背景与动机 - 灵巧操作能力是通用机器人实现多任务泛化的核心能力之一,缺乏该能力则难以完成复杂交互[2] - 多模态大模型在机器人控制中的应用取得初步进展,结合高质量操作演示用于具身推理与通用操作策略学习[2] - 当前硬件存在瓶颈:多数平台依赖双指夹爪,难以完成手内操作等细粒度任务;现有灵巧手平台常忽略感知系统的同步性与稳定性,导致数据丢帧、感知不同步等问题[5] - 已有研究显示,多模态传感器集成时常伴随4.4%的掉帧率与高达15–100ms的模态延迟,限制了操作技能多样性与高质量演示数据的采集[5] - 核心挑战在于:缺乏一套紧凑、经济且具备高自由度的多指灵巧手系统,以支持稳定、高质量的数据采集[9] RAPID Hand平台概述 - 该平台是一个全新开源的高自由度灵巧手平台,全称为Robust, Affordable, Perception-Integrated, Dexterous Hand[3] - 平台旨在以低成本、高质量的数据,助力通用机器人灵巧操作的研究[7] - 平台具有20自由度(DoF)的类人结构,集成了腕部视觉、指尖触觉和本体感觉等多模态感知能力[7] - 平台支持毫秒级的时空同步与精准的空间对齐,并提供高自由度的遥操作接口[7] 硬件设计:手部本体与驱动方案 - 采用紧凑的20自由度手部本体设计,引入统一的多指节驱动与传动方案[13] - 通过对电机布局的系统优化,手指厚度被控制在20毫米,兼顾结构紧凑与驱动性能[13] - 驱动方案具体为:远端关节(DIP与PIP)采用直接驱动,近端关节(MCP)则引入并联机构,实现高效、独立的多指节控制[13] - 除拇指外,各手指的DIP和PIP关节,以及拇指的DIP和MCP关节,均由安装于指节的电机直接驱动;而除拇指外各手指的MCP关节与拇指的CMC关节则通过并联机构驱动,实现全手20自由度的独立控制[15] 硬件设计:感知集成框架 - 提出了一种硬件级的全手感知同步框架,可稳定集成腕部视觉、指尖触觉与本体感觉三类传感信息[16] - 该框架实现了高精度的时序对齐[16] 软件系统与数据采集 - 开发了一套高自由度的遥操作接口,可高效采集多样化的接触丰富的操作任务演示[20] - 平台是软硬协同优化的成果:紧凑的20自由度手部结构、稳定的全手感知集成框架与高自由度遥操作接口三者协同设计[20] - 实现了从数据采集到策略部署的闭环链条,确保硬件耐用、感知稳定,并支持灵巧操作任务中高效、高质量的演示数据采集[20] 性能验证与实验对比 - 研究者在三个具有挑战性的手内操作任务上训练一个扩散模型,以验证平台性能[21] - 基于该平台训练的策略在操作表现与稳定性方面均优于已有方法[21] - 平台在手部结构设计与多模态感知集成两方面均优于现有代表性灵巧手(LEAP、Allegro),同时具备低成本、高可获得性的优势[21] - 在遥操作手内物体平动对比中,Allegro容易掉落,LEAP几乎无明显运动,而RAPID实现了更自然的指间横向移动[5] - 在手内平动与滚动任务中,该平台在无需加速播放的情况下自主完成操作,且相较于先前方法固定机械臂末端、依赖桌面支撑等简化设置,该平台在放宽这些限制条件下仍实现了稳定的自主操作[24] - 在多指翻找任务中,该平台在无需加速播放的情况下自主完成类似人类翻找抽屉的任务,其训练的策略在操作表现上显著优于同期仅依赖单指扫动并使用ArUco标记进行感知的方法[26]