Workflow
经验时代
icon
搜索文档
图灵奖得主理查德·萨顿:人工智能进入“经验时代”,潜力超以往
贝壳财经· 2025-09-11 04:47
人工智能发展现状 - 人类数据红利正逼近极限 大多数机器学习目标是将人类已有知识转移到静态AI [1][2] - 现有方法不能生成新知识 不适合持续学习 而持续学习对智能效用至关重要 [2] - 强化学习带领进入经验时代 需要智能体与世界直接交互生成新数据源 [2] 经验时代技术方向 - 经验指观察 行动和奖励三种信号在智能体与世界间传递 知识来自于经验 [2] - 智能体智能程度取决于预测并控制自身输入信号的程度 经验是一切智能核心 [2] - 释放全部潜力需要持续学习技术和元学习技术 目前这两项技术尚不成熟 [2] 人工智能协作理念 - 对人工智能恐惧被夸大 是被某些从中获利组织和个人煽动 [3] - 目标不同智能体可通过去中心化协作实现双赢 人工智能和人类繁荣将来自去中心化协作 [3] - 人类最卓越超能力在于比其他动物更擅长协作 经济市场与政府都是成功协作产物 [3] 人工智能未来预测 - 对世界如何运转没有共识 没有哪种看法能凌驾其他 [3] - 人类将真正理解智能并借助技术创造出来 [3] - 当今人类智力水平将被超级人工智能或超级智能增强人类远远超越 [3] - 权力和资源会流向最聪明智能体 人工智能替代将不可避免 [3] 宇宙时代与人工智能定位 - 宇宙历史分为粒子时代 恒星时代 复制者时代和设计时代 [4] - 人类独特之处在于把设计推向极致 创造出能自己设计的事物 [4] - 人类是催化剂和助产士 是开启宇宙第四大时代设计时代的先驱 [4] - 人工智能是宇宙演化必然下一步 应以勇气自豪和冒险精神迎接 [4]
图灵奖得主萨顿:人们对人工智能的恐惧被夸大了
第一财经· 2025-09-11 04:06
AI是宇宙演化的必然下一步,人类应以勇气、自豪和冒险精神来迎接它。 "欢迎来到'经验时代'。"9月11日,2025·Inclusion外滩大会在上海举行,2024图灵奖得主、"强化学习之 父"理查德·萨顿在主论坛演讲中表示,人工智能需要一种能够伴随智能体能力提升而持续增长与优化的 新型数据源,传统静态数据库已不足以支撑其进一步发展。 萨顿认为,我们当前仍处于"人类数据时代",AI系统主要通过预测人类语言和标签进行训练,绝大多数 机器学习仍是将人类已有知识迁移至一个静态、缺乏自主学习能力的人工智能体系中。然而,人类数据 的利用正逐渐接近极限。 他指出,现在我们要进入"经验时代",智能体将以第一人称视角与世界互动,直接生成被称为"经验"的 新数据源。这种机制与人类及其他动物的学习方式高度一致——通过与认知水平相匹配的自我体验获取 发展所需的数据。 "去中心化"的定义是每个智能体追求自己的目标,这正是经济体系的运行方式,人工智能的政治议题 中,他强调人类需要寻求协作、支持协作,并致力将协作制度化。 对于人工智能与哲学,理查德·萨顿则认为,人工智能是人类最古老的追求之一,它并不是陌生的外来 技术,而是与人类的本性高度 ...
AI跨步进入“经验时代”
华尔街见闻· 2025-09-11 03:50
AI行业发展趋势 - AI行业正从依赖人类数据的"人类数据时代"转向以持续学习为核心的"经验时代" [2] - 人类数据红利逼近极限 持续学习对智能效用至关重要 [2] - 新数据源需通过智能体与世界直接交互生成 类似AlphaProof通过该路径获国际数学奥林匹克银牌 [2] 技术发展需求 - 强化学习已引领进入经验时代 但需突破持续学习(continual learning)和元学习(meta-learning)技术瓶颈 [2] - 智能体智能程度取决于预测并控制自身输入信号的能力 经验是一切智能的核心基础 [2] AI与人类协作关系 - AI替代人类不可避免 是宇宙演化的必然下一步 [4][5] - AI恐惧被夸大 由某些获利组织煽动 去中心化协作可实现双赢 [3] - 人类最卓越超能力是协作 AI和人类繁荣将来自去中心化协作 [3] 未来发展方向 - 宇宙历史分为粒子时代、恒星时代、复制者时代和设计时代 人类正开启"设计时代" [4] - 人类独特之处在于将设计推向极致 创造能自我设计的事物 [4] - 权力和资源将流向最聪明的智能体 人类智力水平将被超级AI或智能增强人类超越 [3]
“强化学习之父” 理查德·萨顿:人类数据红利逼近极限,AI正进入以持续学习为核心的“经验时代”
证券时报· 2025-09-11 03:50
人工智能发展趋势 - 人类数据红利正逼近极限 人工智能进入以持续学习为核心的经验时代 潜力远超以往 [1] - 经验指观察 行动和奖励三种信号在智能体与世界间传递 知识来自经验 智能程度取决于预测和控制输入信号的能力 [2] - 强化学习带领进入经验时代 但需持续学习和元学习技术释放全部潜力 目前这两项技术尚不成熟 [2] 人工智能发展路径 - 新数据源需由智能体与世界直接交互生成 类似AlphaGo自我博弈和AlphaProof获国际数学奥林匹克银牌的路径 [1] - 人工智能替代人类不可避免 人类是催化剂和助产士 是开启宇宙第四大设计时代的先驱 [2] - 人工智能是宇宙演化的必然下一步 应以勇气 自豪和冒险精神迎接 [3] 人工智能协作机制 - 对人工智能恐惧被夸大 目标不同的智能体可通过去中心化协作实现双赢 [2] - 人类最卓越超能力是协作 经济 市场与政府都是成功协作产物 [2] - 人工智能和人类繁荣将来自去中心化协作 协作是世间美好事物源泉 需寻求支持并制度化 [2]
强化学习之父” 理查德·萨顿:人类数据红利逼近极限,AI正进入以持续学习为核心的“经验时代
证券时报网· 2025-09-11 03:26
人工智能发展趋势 - 人类数据红利正逼近极限 人工智能正在进入以持续学习为核心的经验时代 潜力将远超以往 [1] - 经验指的是观察 行动和奖励三种信号在智能体与世界之间来回传递 知识来自于经验 智能程度取决于预测并控制自身输入信号的程度 经验是一切智能的核心与基础 [2] - 强化学习带领进入新的经验时代 但要释放全部潜力还需要持续学习和元学习两项尚不成熟的技术 [2] 人工智能发展路径 - 需要新的数据源 由智能体与世界直接交互中生成 这是人类和其他动物的学习方式 也是AlphaGo自我博弈和AlphaProof在国际数学奥林匹克斩获银牌的路径 [1] - 人工智能的恐惧被夸大 目标不同的智能体可以通过去中心化的协作实现双赢 [2] - 人工智能和人类繁荣将来自于去中心化协作 协作是世间一切美好事物的源泉 必须寻求协作 支持协作并致力将协作制度化 [2] 人工智能历史定位 - 人工智能的替代将是不可避免的 人类是催化剂和助产士 更是开启宇宙第四大时代设计时代的先驱 [2] - 宇宙历史分为四个时代:粒子时代 恒星时代 复制者时代和设计时代 [2] - 人工智能是宇宙演化的必然下一步 应以勇气 自豪和冒险精神来迎接它 [3]
图灵奖得主理查德·萨顿:我们正进入“经验时代”需要一种新的数据源
新浪科技· 2025-09-11 02:51
人工智能发展趋势 - 当前人工智能处于"人类数据时代" 训练目标是预测人类语言和标签 由人类专家微调 但这种方法无法生成新知识且缺乏持续学习能力[2] - 正在进入"经验时代" 需要新型数据源 其随智能体能力增强而增长 类似自我博弈或第一人称互动生成 称为经验 这是AlphaGo创造第37步和AlphaProof获国际数学奥赛银牌的方式[1][3] - 经验包含观察 行动和奖励三项具体要素 构成智能体与世界交换的信号 强化学习领域基于此思维模式 知识来源于经验[4] - 完全智能的智能体必须从经验中学习 这超出大型语言模型范畴 需要持续学习和元学习技术释放经验全部潜力[4] 人工智能政治影响 - 人工智能已成为高度政治化议题 涉及国家地缘政治竞争 公众担忧偏见 失业和人类灭绝风险 部分国家立法限制模型能力 呼吁暂停研究[5] - 对人工智能的恐惧被夸大且由获利组织煽动 实际与人类历史挑战无异 智能体社会目标应是多元而非唯一 类似经济体系运行方式[6] - 去中心化协作是共同目标的替代方案 每个智能体追求自身目标 通过互动实现双赢 人类超能力在于协作 依赖语言和货币制度[7] - 当前存在对人工智能中心化控制的呼声 包括对齐目标 暂停研究 限制算力和竞争 但人工智能和人类繁荣源于去中心化协作 需抵制非协作呼声[8] 人工智能哲学意义 - 人工智能是人类最古老追求 与人类本性高度相似 数千年来哲学家探索心智运作机制 理解智能是科学与人文学科共同追寻的圣杯[9] - 预测人工智能未来的四条原则:全球无统一世界观 人类终将理解并创造智能 智能水平将被远超 权力资源流向最聪明智能体 人工智能替代不可避免[9][10] - 宇宙历史分为粒子时代 恒星时代 复制者时代(生命时代)和机器与设计时代 设计事物占据主导 人类角色是将设计推向极致[10] - 人类独特之处在于将设计提升至前所未有高度 创造出能自行设计的事物 作为催化剂和先驱开启宇宙第四时代"设计时代"[11]
下一代 AI 系统怎么改?让 AI 自己改?!
机器之心· 2025-07-12 10:54
下一代AI系统自我改进 - 互联网人类数据枯竭及局限性推动AI转向「自进化」范式 通过机器与世界互动生成经验数据实现自我改进 突破人类知识边界 [1][4] - 图灵奖得主Richard Sutton提出「经验时代」构想 主张智能体通过自身经验学习获得超人类能力 当前AI方法依赖人类知识输入需突破该范畴 [4] - 「达尔文哥德尔机(DGM)」为代表的自进化技术 通过修改Python代码库实现自我改进 SWE-bench性能从20%提升至50% Polyglot从14.2%提升至30.7%超越人工设计模型 [5][6] 自进化与SL/RL技术差异 - 自进化依赖模型生成训练数据 数据管理算法需纳入学习框架 监督学习(SL)依赖人类标注数据 强化学习(RL)因通用性难以适配自我改进需求 [7][8] - ICLR 2025设立自进化主题研讨会 探讨无监督下合成数据提升模型性能 接收80篇论文覆盖多智能体系统、机器人自进化等领域 [7] - 自进化存在训练崩溃风险 传统RL因奖励信号机制可避免该问题 需结合基础模型、认知神经科学等多领域实现技术突破 [8][9] 具身智能赛道发展动态 - 智元资本运作先于技术成熟 收购上纬新材引发行业关注 主流企业倾向「自研本体+定制模型」路径 双系统架构在高复杂场景稳定性受关注 [2] - 本体形态差异驱动模型设计分化 轮式/四足/人形机器人对应不同技术方案 2025年上半年资本偏好成为行业焦点 [2] - Figure AI筹备量产 借鉴飞机公司经验实现机器人能力指数级突破 摒弃「可爱型」设计避免人类沦为技术仆从 [3]
AI将受困于人类数据
36氪· 2025-06-16 12:34
AI发展时代划分 - 当前处于从"人类数据时代"向"经验时代"转型的关键拐点 所有大型语言模型依赖互联网文本和人工标注等"二手经验"训练 但高质量人类数据已被快速消耗殆尽 新增语料的边际价值正急剧下降 [2][5][7] - 人类数据时代特征:AI系统训练基于人类生成的文本和图像 通过预测人类下一个词进行学习 而非预测世界 该策略已接近极限 [5][6] - 经验时代特征:智能体需通过与环境实时交互生成原生数据 数据源随智能体能力提升而指数级扩张 学习方式类似婴儿探索玩具或运动员赛场决策 [6][7][10] 技术实现路径 - 强化学习框架已验证可行性:AlphaGo通过模拟移动后果产生经验学习创造性策略 AlphaProof在国际数学奥林匹克竞赛中通过操作后果预测实现突破 [8][10] - 未来技术方向:智能体需建立自生奖励信号和世界模型 发展高保真环境下的长期记忆体系 通过高并行交互提升样本效率 [3][7][11] - 持续学习算法是关键瓶颈:当前AI尚无法实现完全从经验中学习 需开发更强算法支持智能体作为世界知识的可定制接口 [11] 社会治理哲学 - 去中心化合作优于中心化控制:多元目标并存的生态系统通过分布式激励保持创新活力 类比自然界不同生物拥有差异化目标的经济体系 [12][13][16] - 合作机制是核心优势:人类通过语言和金钱实现远超其他物种的合作规模 但需建立制度防范作弊者(如战争、欺诈)同时避免中心化权威僵化 [13][14][16] - AI治理警示:限制AI发展的呼吁与控制人类社会的历史论调高度相似 应警惕基于恐惧的单一目标束缚 保持多样化追求可降低单点失效风险 [15][16] 行业演进展望 - 合成数据成为新趋势:科技公司因人类数据边际效益递减而转向合成数据领域 [2] - 里程碑案例验证路径:从AlphaGo的模拟经验到AlphaProof的现实经验 显示大型语言模型正通过API接入等方式初步进入经验时代 [10] - 长期工程属性:实现超级智能需数十年持续投入 属于马拉松式发展而非短期突破 [10]
AI将受困于人类数据
腾讯研究院· 2025-06-16 09:26
AI发展拐点:从人类数据时代迈向经验时代 - 当前大型语言模型依赖互联网文本和人工标注等"二手经验"训练,但高质量人类数据已被快速消耗殆尽,新增语料的边际价值正急剧下降 [1][7] - 模型规模继续膨胀却收效递减的"规模壁垒"现象显现,大量科技公司开始转向合成数据 [1] - 智能体必须像婴儿学习玩具、足球运动员在赛场决策那样,通过与环境交互不断生成并利用第一手经验,而非单纯模仿人类旧有文本 [1][8] 经验时代的技术特征 - 智能体需要在真实或高保真模拟环境中持续运行,用环境回馈而非人类偏好作为原生奖励信号 [2] - 发展能够长期复用的世界模型与记忆体系,并通过高并行交互大幅提升样本效率 [2] - 强化学习范例(如AlphaGo、AlphaZero)已证明从模拟经验到现实经验的演进路径 [5][12] 去中心化合作的发展哲学 - "去中心化合作"优于"中心化控制",多元目标并存的生态系统通过分布式激励与竞争协作保持创新活力 [2][16] - 让智能体和人类都保持多样化追求,能降低单点失效与僵化风险,为未来AI治理提供更具韧性的框架 [2] - 人类最大的成功是合作(如经济、市场和政府),最大的失败是合作的失败(如战争、盗窃) [16][17] AI发展的三个阶段 - 模拟时代:AlphaGo、Atari等强化学习智能体从模拟经验中学习 [12] - 人类数据时代:ChatGPT和大型语言模型依赖人类生成的数据 [12] - 经验时代:智能体通过与世界互动的经验学习,AlphaProof是早期例证 [12] 智能体的核心能力构建 - 智能体需要像婴儿那样通过感知-行动循环凭第一人称经验自我学习 [5][8] - 知识必须关于经验而非文字,智能程度取决于预测和控制输入信号(特别是奖励信号)的能力 [10] - 强化学习框架让智能体成为能够做决定、实现目标、与世界互动的一流智能体 [10]
强化学习之父Richard Sutton:人类数据耗尽,AI正在进入“经验时代”!
AI科技大本营· 2025-06-06 10:18
AI技术演进与经验时代 - 当前AI发展正从"人类数据时代"转向"经验时代",依赖静态人类数据的模式已接近极限,高质量数据源基本耗尽[9] - 真正的智能应源于动态经验交互而非预设数据,智能体需通过第一人称视角与环境持续互动获取成长性数据源[6][9][13] - AlphaGo的"神之一手"和AlphaProof数学推理证明经验交互的价值,游戏/数学等规则明确领域已实现突破[12] - 经验定义为传感器输入与执行器反馈的闭环,类似婴儿探索或运动员实时决策的高带宽感知-行动机制[10][11] 智能体AI的技术特征 - 智能本质在于预测与控制感官输入的能力,即预判环境反馈并制定策略的因果认知[6][13] - 持续学习(Continual Learning)是核心挑战,现有大语言模型缺乏与世界模型结合的规划能力[17][34] - AI智能体(Agentic AI)需具备目标导向、环境互动和记忆更新能力,当前强化学习尚未解决现实世界不确定性[13][34] - 从模拟时代(AlphaGo)→人类数据时代(GPT-3)→经验时代的技术演进路径已明确[14] 去中心化合作的社会模型 - 超级智能体或被增强的人类将带来净正面影响,技术失业等问题属转型阵痛[3][17] - 社会运作应基于多样目标个体的互惠协作,类似市场经济中差异化分工带来的高效系统[21][24] - 语言和货币是促进人类合作的关键发明,合作失败案例(战争/腐败)源于机制失效而非技术本身[23][25] - 中心化控制(蜂群模式)与去中心化合作存在根本张力,后者更具韧性和抗欺诈能力[24][25] AI治理与发展争议 - AI安全争论本质是"改变AI本身"与"改造社会环境"两种路径的分歧,后者更可持续[31] - 限制AI目标或算力的主张与政治领域的言论自由/贸易保护争议具有相似性[26] - 《苦涩的教训》指出可扩展计算优于人为规则,从人类数据转向经验数据印证这一观点[35][36] - AGI实现需突破持续学习和世界模型规划,预计时间跨度5-15年而非短期[34]