Workflow
物理与数据的结合
icon
搜索文档
具身智能学界业界思想「惊人的统一」?美团在IROS开了个学术年会
机器之心· 2025-10-21 09:32
会议背景与美团机器人业务进展 - 美团机器人研究院在杭州IROS会议期间举办学术年会,主题为“Robotics for better life”,聚焦具身智能与零售服务结合[3][5] - 美团无人机配送服务已初具规模并开启全球化运营,是全国唯一获民航局批准在所有城市(包括夜间)运营无人飞行器的公司[5] - 美团机器人研究院在IROS会议中有6篇相关工作参会,最具代表性的研究成果是开放世界目标检测与理解算法“DINO-X”[7] 席宁教授:机器人规划范式的变革 - 研究核心是从传统机器人规划范式转向更有效利用人工智能方法[13] - 提出GAT模型以结合物理模型与数据驱动模型,解决纯机器学习模型不遵循物理定律的问题,该模型是合作博弈而非对抗博弈[16][17][18][19] - 提出非向量空间模型以处理复杂感知信息,通过模型集合差替代向量差进行控制,并采用压缩感知避免特征变化导致的跟踪失败[26][28] - 强调应以感知为参照系进行机器人轨迹规划,而非时间函数,从而避免遇到障碍物时重新规划[29][32][35] 王潜(自变量CEO):具身智能基础模型的特征 - 具身智能是基础模型而非简单的大模型加硬件,其核心特征为端到端、通才模型、基于物理世界[38][40][43][45][46] - 物理世界随机性极大,Manipulation任务刚起步,面临传统虚拟世界模型不会遇到的问题(如瓶盖盖不紧导致交互结果迥异)[41][42] - 在人类互联网数据接近干涸的背景下,数据质量与多样性比数量更重要,模仿学习已逼近人类数据量极限,未来需依靠体验学习突破数据瓶颈[49][50][52][53] 圆桌论坛:具身智能发展的第一性原理 - 硬件成本与重量相关是直观第一性原理,但软件和AI领域对“智能”的定义仍需提炼[57] - 具身智能是“躯体和灵魂”合二为一,未来模式是“牛顿+辛顿”结合物理规律与数据驱动学习能力,需具备小脑、中脑、大脑和云脑[57] - 智能由欲望驱动,需给机器人欲望;生物DNA携带先验知识,如何将其移植到神经网络是关键;经验是完成世界闭环的重要部分[58][59] - 具身智能不能简单归为大模型子课题,其由传感、信息处理与推理、能量输出三个模块组成,信息与能量的流动是系统生命力[60]