Workflow
Scaling时代
icon
搜索文档
Ilya重磅发声:Scaling时代终结,自曝不再感受AGI
36氪· 2025-11-26 06:54
当前AI技术路线评估 - 当前模型持续改进但无法实现AGI,现有技术路线后劲不足[3] - 真正可行的AGI系统架构至今尚未掌握构建方法[3] - 模型泛化能力远逊于人类,即使使用所有编程竞赛题目训练仍无法形成真正的解题直觉[3] - 评测结果与现实应用出现明显脱节,评估分数光鲜但实际性能滞后[5][8] - RL训练最终演变为对评估指标的过度优化,真正的奖励机制黑客是设计基准测试的科研人员[3][6] Scaling Law与预训练瓶颈 - 预训练时代已终结,行业正从Scaling时代走向研究时代[1][13][14] - 预训练最大突破是Scaling配方好用,但数据有限总有用光之时[12] - Scaling把行业创新空气吸干,导致公司数量远远多于点子数量[15] - 未来创新将回归小而美实验,类似AlexNet用两张GPU、Transformer用8-64块GPU的模式[16][18] - 已见证从预训练Scaling切换到RL Scaling,但RL非常烧算力且效率低[15] 模型泛化能力与学习机制 - 人类学习能力来自自进化硬编码的价值函数,情绪是决策系统一部分而非噪音[10] - 当前AI的价值函数训练方式脆弱粗糙,还不是内置的[11] - 预训练优势在于数据量大且无需刻意挑选,具有天然高度真实性[8] - RL训练让模型目标变得单一狭隘,削弱全局感知能力[5] - 模型在基础任务上表现不佳,如在修复bug时会反复犯同样错误[5] AGI/ASI发展路径与影响 - ASI可能在5-20年内降临,实现人类级别学习能力后变得超越人类[3][51] - 超级智能不是完成形态心智,而是能够学会做每一项工作的心智[29][30] - 部署将包含通过试错学习时期,是过程而非直接投放最终成品[29] - 一旦实现这种学习算法,可能会迎来一波快速的经济增长[32] - AGI与AI的本质区别在于力量,当力量很大时会发生难以想象的事情[38][40] 行业趋势与安全考量 - 随着AI变得更强大,政府和公众会产生做点什么的愿望,公司将更加充满危机感[43][44] - 竞争激烈的公司开始在AI安全方面合作,OpenAI和Anthropic已迈出第一步[44] - 构建稳健对齐、专门关爱有感知生命的AI比仅关爱人类生命的AI更容易[48][49] - 渐进主义将是任何AGI计划与生俱来的组成部分,逐步发布可分散冲击力[19]
Scaling时代终结了,Ilya Sutskever刚刚宣布
机器之心· 2025-11-26 01:36
AI行业技术发展现状 - 当前AI模型存在"参差不齐"现象,在复杂评测中表现出色却在简单任务上反复犯错,如修复Bug时引入新Bug[20] - 这种现象源于"奖励黑客行为",研究人员过度针对评测集进行强化学习训练,导致模型缺乏真正理解和泛化能力[11][23] - 模型表现类似于"刷题家",通过大量针对性训练获得表面能力,但缺乏真正的智能天赋[24][25] AI学习机制与人类对比 - 人类学习效率远高于AI,样本效率更高,这得益于进化留下的先验知识和内在学习机制[43][44] - 情绪在人类决策中扮演类似价值函数的角色,帮助在获得最终结果前判断决策好坏[29][32] - 人类拥有基于价值函数的内在学习机制,能够进行持续学习和自我纠正[11][35] AI发展阶段转变 - 扩展时代(2020-2025)以堆算力和数据为主旋律,通过预训练获得性能提升[38][39] - 当前预训练数据即将耗尽,单纯扩大规模的边际回报递减,行业进入"研究时代"[39][40] - 新阶段需要寻找新的"配方",更聪明地使用算力,特别是在强化学习和推理过程中[40][41] Safe Superintelligence Inc战略 - 公司采用"直通超级智能"策略,专注于研发直到解决安全超级智能问题后再发布[9][59] - 目前专注于研究,不急于通过产品获利,避免商业竞争的"老鼠赛跑"[9][58] - 公司筹集30亿美元资金,专注于技术研究而非推理产品开发[56][57] 对齐与未来展望 - 核心对齐目标是"关爱感知生命",这比单纯"听从人类指令"更稳健[9][76] - 未来可能出现多个大陆级规模的AI集群,只要前几个最强大的AI是对齐的,世界可能进入良性发展轨道[9][78] - 长期均衡状态可能是人类通过脑机接口与AI融合,成为"半AI"[9][82] 技术发展方向 - 价值函数将在未来AI发展中发挥重要作用,提高强化学习效率[34][41] - 根本性挑战是提高模型泛化能力,这比人类差得多[41][47] - 需要重新思考训练方式,实现类似人类的持续学习能力[48][49] 行业竞争格局 - 当前AI公司比想法多,扩展战略导致同质化竞争[53][99] - 随着AI能力增强,公司将更注重安全合作,行为模式将发生变化[74][75] - 未来可能出现专业化竞争,不同公司在不同经济领域占据优势[94] 研究哲学与方法 - 优秀研究依靠"自上而下"的信念,追求美、简单性和对生物学的正确借鉴[22] - 当实验数据与直觉相悖时,基于美的信念能支撑研究者继续寻找问题根源[22] - 真正的突破性研究不一定需要最大算力,Transformer等关键突破都是在相对有限算力下实现的[54][55]