Dwarkesh最新播客：AI 进展年终总结

AI发展现状与AGI时间线 - 以强化学习为核心的“中训练”正成为大型语言模型的重点突破方向，前沿科技公司正通过此方法将大量具体技能预先植入模型[3] - 当前对强化学习中训练的极度乐观态度与宣称AGI临近的观点存在根本矛盾，如果模型已接近类人学习者，这种基于“可验证结果”的训练路径是走不通的[14] - 为模型预置大量具体技能的做法，恰恰是AGI还很远的证据，因为如果模型泛化能力很强，就不需要单独构建那么多强化学习环境来教它操作特定工具[3][16] AI模型能力与泛化挑战 - 人类劳动力的价值在于其训练成本不笨重，能根据需要灵活掌握新技能，而当前AI缺乏稳健高效的方法来习得工作中大量需要的公司特定、情境特定技能[4][23] - 每天人类需处理上百件需要判断力、情境感知及工作中习得技能的事情，仅靠预置一组固定技能，连一份工作都无法完全自动化[24] - 在机器人等领域，根本问题是算法而非硬件或数据，人类只需很少训练就能远程操控硬件完成有用工作，这反衬出当前AI缺乏类人学习核心[19] AI经济扩散与市场潜力 - 企业有很强动机雇佣AI劳动力，因为经过验证的AI员工可以无损无限复制，且不存在招聘中的“柠檬市场”问题[5][29] - 当前AI未在企业广泛部署、未在编程外创造大量价值，本质是模型能力不足，而非技术扩散需要时间，所谓“经济扩散滞后”是为能力不足找借口[6][28] - 如果AI能力真达到AGI水平，其扩散速度会快得惊人，企业完全愿意每年花费数万亿美元购买token，因为知识工作者年总薪酬高达数十万亿美元[29] 技术演进路径与规模定律 - 预训练阶段的扩展定律非常清晰，算力数量级提升会导致损失函数稳定下降[10] - 但将预训练规模化的乐观经验移植到带可验证奖励的强化学习上缺乏依据，有研究指出，要强化学习获得类似GPT级别的提升，总算力规模可能需要提升到一百万倍[11][33] - 持续学习将是AGI之后模型能力提升的主要驱动力，预计前沿团队明年会发布持续学习雏形功能，但达到人类水平可能还需5到10年[13][40] 评估框架与未来影响 - 将AI模型智能与“中位数人类”对比会系统性高估其能创造的价值，因为知识工作的巨大价值来自最顶尖的一小撮人[12][35] - 一旦模型真正达到顶级人类水平，其影响力可能是爆炸式的，因为这意味着服务器上运行着数十亿个类人智能体，能复制、融合彼此全部学习成果[12][25] - 模型在“看起来很厉害”上的进步速度符合短时间线派预测，但在“真正变得有用”上的进展速度更符合长时间线派判断[32]