Workflow
思考型模型
icon
搜索文档
DeepMind CEO定义世界模型标准:不仅理解物理世界,还能创造它
36氪· 2025-08-14 01:57
DeepMind技术突破与战略布局 - 公司近期密集发布包括Deep Think、Genie 3等约50个项目,研发节奏显著加快,成果覆盖数学奥赛金牌、世界模型生成等领域 [3] - 世界模型Genie 3实现突破性进展,生成虚拟世界具备物理一致性(如水流、倒影等),验证了底层物理理解能力 [1][8][9] - 终极目标是开发融合语言、多媒体、物理推理的"全能模型"(Omni Model),推动AGI安全落地 [2][18] 思考型模型与AGI演进路径 - "思考型模型"通过叠加规划能力实现多路径并行推演与自我修正,是AGI核心路径 [3][4][7] - 模型能力呈现"参差型智能":可生成完整虚拟宇宙但可能在国际象棋中违规,反映推理与一致性短板 [1][12] - 早期游戏AI(如AlphaGo)奠定智能体系统基础,当前多模态模型已扩展至语言、物理等多领域 [3][7] Genie 3的应用前景 - 作为训练平台:支持AI智能体(如SIMA)在生成世界中执行任务,创造无限训练数据 [10] - 娱乐创新潜力:可能催生电影与游戏融合的新形态,公司透露长期布局游戏领域计划 [10][21] - 科学价值:生成世界的物理一致性为现实本质研究提供新视角 [11] 行业技术挑战与评测体系 - 现有评测基准(如AIME数学测试)接近饱和(Deep Think达99.2%),需开发覆盖物理直觉、安全性等的新评估体系 [13] - "游戏竞技场"成为重要评测场景,延续游戏AI传统优势,未来或引入AI自创游戏对战 [13] - 工具调用能力成为新扩展维度,需经验性平衡内化能力与外部工具使用(如数学程序、搜索引擎) [15][16] 开发者与产品化方向 - 建议开发者聚焦高价值工具构建,产品设计需预判1年后技术状态并支持3-6个月重大更新 [17] - 模型向系统进化:工具调用与规划能力结合可能带来指数级能力扩展 [17] - 网络生态将因智能体系统灵活使用工具发生根本性变革 [18]