Workflow
评测基准
icon
搜索文档
DeepMind哈萨比斯:智能体可以在Genie实时生成的世界里运行
量子位· 2025-08-13 07:02
世界模型与Genie 3技术进展 - Genie 3能实时生成可交互的虚拟世界并让智能体在其中运行,标志着世界模型技术取得突破[3][5][35] - 世界模型需理解物理规律、材料特性及生物行为,这是实现AGI的必要条件[33][34] - Genie 3已实现720p分辨率、多分钟交互时长及可导航的提示性世界事件生成能力[32] DeepMind发展动态 - 公司研发节奏持续加速,几乎每天都有新成果发布,包括DeepThink、IMO金牌模型等里程碑[9][15][18] - 智能体系统从早期游戏领域扩展到多模态模型,现正通过整合思考规划能力向AGI迈进[24][25] - 强化学习仍是核心技术路径,2010年至今持续投入并验证其可扩展性[27][28] AI能力评估与Game Arena平台 - 现有模型表现参差不齐:IMO金牌级数学能力与高中基础题错误并存[11][29] - 行业亟需新评测基准,需覆盖物理直觉、多目标优化等更复杂维度[13][45][46] - Game Arena平台通过数千款游戏动态测试AI能力,支持模型间对抗与自动难度调整[47][48][53] 工具整合与系统进化 - 工具使用能力成为AI新扩展维度,需平衡内置功能与外部工具调用[63][64][66] - 模型正向系统级进化,能组合调用数学软件、搜索引擎等工具完成复杂任务[68][69] - 产品设计需预测技术发展节奏,保持架构灵活性以适应快速迭代[72] 技术融合与AGI路径 - Genie、VO、Gemini等模型正朝"全能模型"方向融合,形成统一能力体系[75][76] - AGI需具备自主转化人类意图为动态奖励函数的能力,解决多目标优化难题[23][60] - 物理模拟器可能成为关键工具,帮助AI理解并操作现实世界[33][63]