通往通用人工智能的关键一步？DeepMind放大招，3D世界最强AI智能体SIMA 2

产品发布与定位 - Google DeepMind发布SIMA 2，这是一个能在虚拟3D世界中自主游戏、推理并持续学习的通用AI智能体[2] - 公司创始人将其定义为通往通用人工智能的关键一步[3] - SIMA 2代表了从SIMA 1的重大飞跃，是创建通用和有益AI智能体研究的下一个里程碑[6] 技术架构与核心能力 - SIMA 2集成Gemini模型的先进能力，从被动的指令遵循者进化为交互式游戏伴侣[6] - 新架构将SIMA 1的语言->行动模式升级为语言->意图->计划->行动的多步骤认知链[15] - 智能体不仅能遵循人类指令，还能在未见过的复杂环境中进行自主规划、解释行动步骤、与用户实时对话[6] - 通过试错与Gemini反馈的闭环机制自我迭代，提升技能[6] 性能提升与泛化能力 - SIMA 2能理解更复杂、更细微的指令，执行指令时成功率更高，尤其在未训练过的游戏中表现出色[24] - 具备理解多模态提示的能力，包括不同语言和表情符号[26][29] - 迁移学习能力显著，例如将一种游戏中对"采矿"的理解应用到另一种游戏的"收获"概念中[30] - 在多种任务上的表现已显著接近人类玩家水平[30] 创新测试与自我进化 - 与Genie 3结合测试时，SIMA 2能在全新生成的世界中合理定位、理解指令并采取有意义的行动[32] - 具备自我提升能力，能够通过试错法和基于Gemini的反馈执行日益复杂和新颖的任务[35] - 经过多代训练后，智能体可在完全无需人类反馈或游戏数据的情况下实现自我进化[39] 行业意义与应用前景 - 该技术对机器人技术和人工智能的未来具有重要意义，正在构建未来物理世界智能体所需的核心认知构建模块[7] - 智能体学到的技能（导航、工具使用、协作任务执行）都是未来物理世界AI助手所需的智能物理具身化的基本构建模块[43] - 这项研究为面向行动的AI提供了新路径的基础验证，证实了通才型智能体的可行性[43]