Karpathy 2025年AI终极觉醒：我们还没发挥出LLM潜力的10%

文章核心观点 - 2025年是人工智能发展历程中的“觉醒”之年，标志着大语言模型从模仿人类向追求真理的范式转移，其核心驱动力包括RLVR的崛起、Vibe Coding的流行以及关于AI本质的哲学思考[1][3] RLVR革命 - 传统的LLM训练流程包含预训练、监督微调和RLHF三个阶段，但RLHF存在“阿谀奉承”问题，导致模型倾向于生成看似正确但实际错误的答案[4][6] - 2025年兴起的RLVR范式引入第四阶段，其核心是使用可验证的客观结果作为奖励信号，例如用编译器验证代码、用答案验证数学题，从而训练模型进行真正的推理[7][11][12] - RLVR使模型能够通过自我博弈涌现出推理能力，它尝试生成成千上万条不同的推理路径，并由自动验证器进行筛选和强化[15][16][17][18] - 该范式引入了“测试时算力”这一新的扩展定律，模型能力不再在训练结束时定格，推理阶段通过增加“思考时间”可以显著提升表现[19][20][21][22] - 行业案例显示，仅靠纯粹的RLVR训练，模型也能从零开始衍生出强大的推理和自我反思能力，这意味着算力的价值从训练端向推理端转移[23] 哲学分野：动物与幽灵 - AI先驱Rich Sutton的“苦涩教训”认为，长期来看，能利用无限算力的通用方法终将胜出，他心目中的AGI是像动物一样具身、通过试错学习的连续智能体[27][28][29][31] - 然而，当前的大语言模型被描述为“幽灵”，它们无状态、没有持续的意识流，其智能是基于人类互联网文本的统计学蒸馏，是在扮演而非真正理解[32][33] - 目前的科研方向被认为是在召唤更强大的“幽灵”，这是一种位于“心智空间”不同坐标系的、全新的智能形态[35] - 这种智能是“参差”的，它在某些领域表现卓越，但在另一些简单任务上可能严重失误，这种特性源于训练数据分布不均和分词方式的先天缺陷[37][52] Vibe Coding - Vibe Coding代表编程范式的转变，开发者从编写代码细节转变为用自然语言描述意图，将逻辑和实现交由AI完成，人类主要负责审美和验收[40][44] - 行业实践案例显示，一个完整的Web应用项目可以在开发者不手写一行代码的情况下，通过自然语言指令与AI协作完成[41][44] - 2025年AI编程工具形成两大流派：以Cursor/Windsurf为代表的IDE增强派，将AI无缝集成到开发环境中辅助编码；以Claude Code为代表的终端Agent派，能够接受高级指令并自主执行复杂的开发任务[45] - 尽管Claude Code展现了Agent的雏形，但真正的“全自动工程师”尚未到来，当前的Agent在复杂架构任务上仍需人类把控方向[46] - 行业观点认为，Claude Code通过聚焦本地化开发体验，抓住了开发者的核心痛点[46] 范式转移 - 谷歌Gemini Nano Banana模型因其名称和特性引发了病毒式传播，它代表了文本生成、图像生成与世界知识在模型权重中交织的综合能力[47][49] - 一个深刻的行业观点是：文本是计算机偏好的格式，而非人类喜欢的格式，人类更倾向于通过视觉和空间维度接收信息[47][49] - 未来的LLM交互界面应超越文本，以图像、信息图、幻灯片、视频等人类偏好的格式进行输出，这被认为是继图形用户界面后的下一个重大计算范式[47][49] - 大语言模型正作为一种新型智能形态崭露头角，其能力分布不均，既在某些方面远超预期，又在另一些方面显得笨拙，但整体上极其有用[54] - 行业认为，即使以当前模型的能力，其应用潜力也远未被发掘出10%，该领域从概念上看仍感觉广阔无垠[55][56]