世界模型崛起,AI路线之争喧嚣再起
36氪·2025-11-20 01:58

行业技术路线分歧 - 当前AI发展存在核心路线分歧:以大语言模型为代表的文本驱动路径与以世界模型为代表的物理认知路径[3] - 大语言模型受限于文本数据的质量、规模和时效性,存在数据偏见、噪声干扰和认知边界固化的局限[3] - 世界模型派认为语言是人类创造的抽象信号,仅依赖文本无法真正理解物理世界规律,需通过高维感知数据直接建模[4] 世界模型技术特点 - 世界模型通过多模态数据学习现实世界物理规则,具备预测环境状态、物理认知和反事实推理三大核心能力[11] - 技术架构包含状态表征模型(压缩高维数据)、动态模型(预测状态转移)和决策模型(规划最优动作)三大组件[12][13] - 模型使AI从"感知"升级为"推理",从"想象"转化为"行动",为具身智能、自动驾驶等领域提供基础支撑[6] 科技公司布局动态 - 谷歌DeepMind推出Genie 3模型,可实时生成交互式3D环境,在720p分辨率下创建用户可自由探索的动态世界[16] - Meta发布代码世界模型,通过5T tokens执行轨迹数据训练,能逐行模拟代码运行过程,推动AI编程进入动态执行推理新阶段[16] - 英伟达将"物理AI"视为下一个增长点,利用Omniverse平台创建仿真环境支持机器人领域扩张[16] - 特斯拉在自动驾驶系统中嵌入世界模型,构建虚拟环境进行能力学习和验证[17] 技术应用前景与挑战 - 世界模型可应用于机器人、控制、模拟和基于模型的强化学习等领域,推动AI从虚拟交互走向物理世界应用[7][10] - 面临多模态数据收集成本高、缺乏统一标准与评价体系、决策过程可解释性差等技术与生态挑战[20] - 产业层面需解决算法主权、智能监管等制度议题,伦理层面需防范目标漂移和价值观对齐问题[20][21]