李飞飞站队LeCun，AGI全是炒作，80分钟重磅爆料出炉

AI发展历程与驱动力 - 21世纪初AI领域处于漫长寒冬，更常被称为机器学习，公众关注度低且资金投入少[10][14] - 2006-2007年启动ImageNet项目，从互联网搜集1500万张图像并打上22000个类别的精准标签，该项目开源并启动年度挑战赛[21][23] - 2012年多伦多大学研究团队使用2块英伟达GPU和ImageNet数据训练出AlexNet，标志着深度学习与现代AI起步的关键时刻[23][24] - 大数据、神经网络和GPU构成现代AI发展的黄金三件套[6][26] - 2015年中至2016年中，硅谷大厂刻意避谈AI一词，一年后AI拐点出现，众多公司开始将自己定位为AI公司[26] 世界模型与空间智能 - AI未来十年的下一个前沿是空间智能与世界模型，其核心在于将语言之外的智能、具身AI机器人和视觉智能串联起来[28][33] - 世界模型被定义为一个基础层，通过输入一张图或一句话即可生成一个可无限探索的3D世界，人们可在此基础上进行推理、交互和创造[37][38] - 人类作为具身智能体同样能从世界模型和空间智能中获益，例如科学家通过2D X射线衍射照片在脑海中构建3D模型从而发现DNA双螺旋结构[39] - 2024年通过TED演讲系统化阐述空间智能和世界模型理念，并创办World Labs公司以推动该领域发展[34][36] 技术应用与行业影响 - World Labs推出的Marble平台应用于电影虚拟制片、游戏互动内容及机器人模拟训练等领域[41] - 在电影拍摄中，Marble平台通过描述生成可导航的3D世界，使虚拟摄像机自由走位且场景可反复修改，艺术家团队称制作时间缩短40倍[43] - 游戏开发者可将Marble生成的世界导出至游戏引擎用作关卡原型，助力小团队打造大片级场景而不受美术资源限制[43] - 机器人领域面临数据困境，其输出为真实三维世界中的动作，训练数据极难获取，需通过遥操作、合成环境等方式收集[44][45] - 机器人是物理系统，更像自动驾驶汽车而非大语言模型，需同时解决算法模型、硬件本体和应用场景问题，发展路径漫长且挑战多维[45][46] 研究理念与未来方向 - 智能通过大数据学习获得，关键是为机器人提供足够多且多样的世界经验，Marble平台通过提示词生成各种场景供机器人在虚拟世界练习[46] - 在AI与AGI之间没有清晰科学界限，AGI更像营销用语而非严谨科学术语，其定义未统一[26] - 研究者应关注最令人兴奋且难以入眠的科学问题，而非仅聚焦盈利最多的领域，同时不过度放大失败可能性，并重视团队协作价值[47]