别再肝了!Google 发布 SIMA 2,你的下一个游戏搭子可能是个 AI
深思SenseAI·2025-11-21 04:14
SIMA 2核心能力突破 - 新一代通用智能体SIMA 2与Gemini深度集成,能够在虚拟世界理解并执行自然语言指令,执行连续多步操作[1] - SIMA 2超越简单指令执行,通过Gemini作为推理中枢具备思考和推理能力,能够解释意图并描述下一步行动[2] - 智能体可以理解复杂细致指令,执行冗长任务并给予反馈,互动体验接近真实玩家[5] 技术实现与训练方法 - 训练使用大量带语言标注的人类演示视频,结合Gemini自动生成标注进行强化学习[2] - 具备初步对话式协作能力,能用自然语言向用户解释意图并描述行动计划[2] - 通过反复试验加Gemini反馈评估的闭环实现自我改进,不断学会完成更复杂新任务[11] 多模态与环境适应能力 - 借助Gemini出色多模态能力,可以理解图像、表情符号和简洁语言进行互动[6][7] - 在《我的世界》学会挖矿后,能将采集能力迁移到其他未训练过的游戏中[7] - 在Genie 3新生成的3D模拟世界中,即使未受专门训练也能正确辨别方向并执行指令[9][10] 行业意义与发展路径 - SIMA 2是迈向通用交互式具身智能的重要一步,为机器人领域智能具身化提供核心能力模块[15][16] - 通过大规模多世界数据训练叠加Gemini推理能力,将分散的专用系统能力整合进统一通用智能体框架[15] - 虚拟3D世界为具身智能提供可控低成本训练环境,Gemini加SIMA 2组合让会思考的LLM迈向会动手做事的Agent[14]