Workflow
Diana 7 机械臂
icon
搜索文档
只需少量演示即可灵活应对多样物体!阿米奥冯骞团队携低成本精准灵巧操作方案亮相IROS!
具身智能之心· 2025-10-20 00:03
技术方案核心创新 - 提出LensDFF框架,利用语言特征作为语义锚点,通过动态投影公式将CLIP提取的2D视觉特征对齐到3D空间,从根源解决跨视角特征不一致问题,且全程无需微调或额外训练对齐网络[2] - 将5种抓取原语(捏、钩、三脚架等)融入少样本演示,搭配法向量引导初始化和低维eigengrasp优化,使DLR-HIT灵巧手能根据物体形状自适应调整手指动作,显著提升灵巧性[2] - 设计real2sim流水线实现仿真快速调参,端到端耗时压缩至13秒,比SparseDFF快3秒、比F3RM快近5分钟[2] 性能表现与实验数据 - 在12个YCB物体测试中,单视角抓取成功率超40%(仿真)、64%(真实场景),在核心指标(>3秒成功率)上超越F3RM 16.9%、SparseDFF 15.8%[2][30][32] - 特征对齐仅需70毫秒,整体运行时间仅13秒(含SAM2与CLIP推理),真实场景成功率64%,运行时间比SparseDFF短3秒,远快于F3RM的5分钟[2][30][32] - 消融实验验证技术必要性:无特征对齐成功率0%,仅语言增强成功率34.17%,完整LensDFF方案成功率40.83%[33] 行业应用前景 - 技术使机器人在家庭服务、工业分拣等场景中,无需依赖海量数据,仅通过少量演示就能应对多样物体,为低成本落地灵巧操作提供了新路径[3][38] - 方案尤其适用于需要快速适配未知物体的场景,如柔性制造、物流分拣等对机器人操作效率和适应性要求高的领域[38] - 通过多模态大模型的特征蒸馏实现少样本学习,降低了机器人灵巧操作的数据采集和训练成本,提升了技术商业化落地的可行性[3] 公司技术背景 - 技术由阿米奥机器人公司研发,成果一作为公司联合创始人兼技术负责人冯骞,其硕博就读于德国慕尼黑工业大学,师从机器人泰斗Alois Knoll,曾是思灵机器人早期员工、研究科学家[5][39] - 公司团队为复合型作战团队,由汽车/3C大厂高管带队,涵盖科学家、大模型人才及工程落地专家,创始人刘方为小米早期员工及小米汽车自动驾驶产品技术负责人[39] - 公司专注于为全球制造业智能化转型提供核心技术,聚焦工业场景的柔性生产需求,致力于通过自主创新的机器人解决方案重构企业级生产效能[39]