Workflow
具身智能评测平台EmbodiedVerse
icon
搜索文档
智源评测:用数据解码机器人足球赛中的具身智能
具身智能之心· 2025-09-12 00:05
文章核心观点 - 北京智源人工智能研究院(BAAI)具身智能团队在2025世界人形机器人运动会(WHRG)上通过具身智能评测平台EmbodiedVerse对足球赛进行系统化数据分析 旨在通过过程性指标评估机器人综合能力 推动具身智能技术发展 [2][3][4] 机器人足球赛作为评估场景 - 机器人足球赛被选为具身智能的"终极考场" 因其高度动态、对抗性和不可预测的环境能全面测试机器人的感知稳定性、决策适应性和多智能体协作能力 [6][7][8] - 该场景要求机器人在短时间内完成多任务操作 包括感知、定位、追球、射门、躲避与协作 对算法提出极高要求 [8] 过程性量化指标设计 - 突破传统结果导向评价 引入射正次数、门球次数、角球次数、射正率及搬离次数/率等过程性指标 这些指标紧贴机器人技术特征且符合足球裁判标准 [9][11][13] - 搬离次数/率是机器人特有指标 衡量对抗环境中的鲁棒性与稳定性 而射正次数/率、门球和角球次数反映群体协作策略及感知、定位、决策等环节的协同性 [13] 数据驱动的技术洞察 - 感知泛化性存在严重不足:机器人多次将场边白色桌子或广告牌误认为球 暴露视觉模型在真实场景中的脆弱性 需通过多样化数据采集、泛化模型架构和对抗性训练提升 [15] - 中外队伍竞技风格迥异:外国队伍场均射正2.47次、门球1.52次 进攻性更强但搬离率达222% 中国队伍场均角球0.54次 边路推进优势明显且队伍间策略趋同(标准差更低) [17][19] - 赛制影响行为特征:3v3比赛因场地小呈现更高进攻效率(射正率65% 场均射正5.38次) 5v5比赛因对抗性强导致搬离次数显著更高(场均23.88次)且定位球更多 [20][22] 当前能力评估与未来方向 - 优势端:机器人已实现感知-决策-运动控制-多机协作-实时通信的端到端闭环 在角色分配、协作与通信方面展现较好泛化性和鲁棒性 [23] - 短板端:环境适应性不足、感知精度有限、复杂对抗下决策不灵活(如"叠罗汉"场景频发) 需从算法、协作机制和硬件层面优化 [24][25] - 未来重点包括对抗性训练、多样化数据扩展、分布式协作机制优化以及硬件抗干扰能力提升 以缩小与人类水平的差距 [25][26]