Workflow
首款推理具身模型,谷歌DeepMind造!自主理解/规划/执行复杂任务,打破一机一训,还能互相0样本迁移技能
量子位·2025-09-27 04:46

衡宇 发自 凹非寺 量子位 | 公众号 QbitAI 谷歌DeepMind正式发布 新一代通用机器人基座模型 ——Gemini Robotics 1.5系列。 它不止于对语言、图像进行理解,还结合了视觉、语言与动作 (VLA) ,并通过具身推理 (Embodied Reasoning) 来实现"先思考,再行 动"。 全球首个具备模拟推理能力的具身模型来了! 这一系列由两大模型组成: 其中,ER代表"具身推理"。 这意味着GR-ER 1.5是全球首个具备模拟推理能力的具身模型。 不过, GR-ER 1.5并不执行任何实际操作 ,GR 1.5正是为执行层而生。 两者结合,能让机器人不仅完成"折纸、解袋子"这样的单一动作,还能解决"分拣深浅色衣物"甚至"根据某地天气自动打包行李"这种需要理解 外部信息、分解复杂流程的多步任务。 甚至,它能根据特定地点的特定要求 (比如北京和上海的不同垃圾分类标准) ,自己上网搜索,以帮助人们完成垃圾分类。 而且用上GR 1.5系列的模型,还能够在多种不同的机器人之间进行能力的零样本跨平台迁移。 Gemini Robotics 1.5 (GR 1.5) :负责动作执行的多模态大模型; ...