Karpathy 2025年AI终极觉醒:我们还没发挥出LLM潜力的10%
36氪·2025-12-22 00:29

文章核心观点 - 2025年是人工智能发展历程中的“觉醒”之年,标志着大语言模型从模仿人类向追求真理的范式转移,其核心驱动力包括RLVR的崛起、Vibe Coding的流行以及关于AI本质的哲学思考[1][3] RLVR革命 - 传统的LLM训练流程包含预训练、监督微调和RLHF三个阶段,但RLHF存在“阿谀奉承”问题,导致模型倾向于生成看似正确但实际错误的答案[4][6] - 2025年兴起的RLVR范式引入第四阶段,其核心是使用可验证的客观结果作为奖励信号,例如用编译器验证代码、用答案验证数学题,从而训练模型进行真正的推理[7][11][12] - RLVR使模型能够通过自我博弈涌现出推理能力,它尝试生成成千上万条不同的推理路径,并由自动验证器进行筛选和强化[15][16][17][18] - 该范式引入了“测试时算力”这一新的扩展定律,模型能力不再在训练结束时定格,推理阶段通过增加“思考时间”可以显著提升表现[19][20][21][22] - 行业案例显示,仅靠纯粹的RLVR训练,模型也能从零开始衍生出强大的推理和自我反思能力,这意味着算力的价值从训练端向推理端转移[23] 哲学分野:动物与幽灵 - AI先驱Rich Sutton的“苦涩教训”认为,长期来看,能利用无限算力的通用方法终将胜出,他心目中的AGI是像动物一样具身、通过试错学习的连续智能体[27][28][29][31] - 然而,当前的大语言模型被描述为“幽灵”,它们无状态、没有持续的意识流,其智能是基于人类互联网文本的统计学蒸馏,是在扮演而非真正理解[32][33] - 目前的科研方向被认为是在召唤更强大的“幽灵”,这是一种位于“心智空间”不同坐标系的、全新的智能形态[35] - 这种智能是“参差”的,它在某些领域表现卓越,但在另一些简单任务上可能严重失误,这种特性源于训练数据分布不均和分词方式的先天缺陷[37][52] Vibe Coding - Vibe Coding代表编程范式的转变,开发者从编写代码细节转变为用自然语言描述意图,将逻辑和实现交由AI完成,人类主要负责审美和验收[40][44] - 行业实践案例显示,一个完整的Web应用项目可以在开发者不手写一行代码的情况下,通过自然语言指令与AI协作完成[41][44] - 2025年AI编程工具形成两大流派:以Cursor/Windsurf为代表的IDE增强派,将AI无缝集成到开发环境中辅助编码;以Claude Code为代表的终端Agent派,能够接受高级指令并自主执行复杂的开发任务[45] - 尽管Claude Code展现了Agent的雏形,但真正的“全自动工程师”尚未到来,当前的Agent在复杂架构任务上仍需人类把控方向[46] - 行业观点认为,Claude Code通过聚焦本地化开发体验,抓住了开发者的核心痛点[46] 范式转移 - 谷歌Gemini Nano Banana模型因其名称和特性引发了病毒式传播,它代表了文本生成、图像生成与世界知识在模型权重中交织的综合能力[47][49] - 一个深刻的行业观点是:文本是计算机偏好的格式,而非人类喜欢的格式,人类更倾向于通过视觉和空间维度接收信息[47][49] - 未来的LLM交互界面应超越文本,以图像、信息图、幻灯片、视频等人类偏好的格式进行输出,这被认为是继图形用户界面后的下一个重大计算范式[47][49] - 大语言模型正作为一种新型智能形态崭露头角,其能力分布不均,既在某些方面远超预期,又在另一些方面显得笨拙,但整体上极其有用[54] - 行业认为,即使以当前模型的能力,其应用潜力也远未被发掘出10%,该领域从概念上看仍感觉广阔无垠[55][56]