持续学习
搜索文档
大佬开炮:智能体都在装样子,强化学习很糟糕,AGI 十年也出不来
自动驾驶之心· 2025-10-22 00:03
文章核心观点 - AI行业存在过度夸大和脱离实际的现状,AGI的实现仍需约十年时间,其发展将带来每年约2%的GDP增量,但并非以当前主流预期的方式实现[2][3][5][6][10][12][13] AGI发展时间与瓶颈 - AGI的实现预计需要十年时间,当前AI智能体存在认知缺陷,包括不够聪明、缺乏多模态能力、无法进行计算机操作、缺乏持续学习能力等[12][13] - 行业曾过早尝试完整解决方案,如雅达利深度强化学习和OpenAI的Universe项目,但因缺乏足够的表征能力而失败[16][17][18] - 预测未来算法将与当前有所不同,但核心仍将是通过梯度下降训练的大型神经网络,需在架构、优化器、损失函数等方面全面改进[33][34][35] LLM认知缺陷与学习机制 - 大语言模型存在认知缺陷,不擅长编写独特或智力密集型代码,容易误解代码风格并增加不必要的复杂性[40][41][42][43] - 模型记忆能力过强,但缺乏类似人类的反思、知识提炼和合成数据生成过程,导致其输出多样性不足且容易发生模型崩溃[60][61][62][63][67] - 人类学习通过内置硬件和进化编码的算法进行,而LLM通过模仿互联网文档训练,是两种不同的智能路径[19][20][22][23] 强化学习局限性 - 强化学习存在显著缺陷,其通过最终结果奖励整个过程的机制噪音过大,无法有效分配部分信用[50][51][52] - 基于过程的监督虽为替代方案,但自动化分配信用困难,且易受对抗性示例影响,导致模型找到漏洞欺骗评判系统[54][55][56][58] - 人类不使用强化学习进行智能任务,而是通过更复杂的回顾和思考过程,当前LLM缺乏相应机制[21][50][52] 自动驾驶与教育应用挑战 - 自动驾驶实现需要较长时间,因涉及复杂物理世界交互,其难度远高于纯数字知识工作[6][10] - 教育的未来可能涉及AI辅助,但需解决模型当前认知缺陷,如持续学习、知识提炼和长上下文处理等[6][10][31][32] 智能进化与经济影响 - 智能进化类似计算趋势的延伸,超级智能将是社会自动化的进步,逐步承担数字和体力工作[94][95] - AGI对经济的影响主要体现在自动化知识工作,预计可覆盖10%到20%的经济份额,但需考虑社会任务重构和工作界面变化[83][84][85] - AI当前最成熟的应用在编程领域,因代码高度结构化且具备相应基础设施,其他文本处理任务如内容重写等仍面临挑战[88][89][90][92]
Andrej Karpathy 开炮:智能体都在装样子,强化学习很糟糕,AGI 十年也出不来
机器之心· 2025-10-18 05:44
AGI发展时间框架与当前局限 - AGI的实现仍需约十年时间,当前AI代理存在认知缺陷,包括缺乏多模态能力、无法进行计算机操作、缺乏持续学习能力等[10][11] - AI行业存在过于乐观的预测,将当前阶段称为"智能体的十年"更为准确,而非"智能体之年"[10] - 实现真正可工作的AI代理需要解决智能程度不足、持续学习、记忆能力等关键技术瓶颈[11] LLM认知缺陷与技术挑战 - 大语言模型存在严重认知缺陷,无法胜任复杂编程任务,特别是在处理非模板化、智力密集型代码时表现不佳[35][36] - 当前编码模型在理解自定义实现和代码风格方面存在局限,经常误解开发者的编程意图[36][37] - 模型倾向于过度依赖训练数据中的常见模式,难以适应创新性的代码架构和实现方式[38] 强化学习范式的问题 - 强化学习存在根本性缺陷,其通过最终结果反向加权整个过程的机制效率低下[45][46] - 人类并不使用类似强化学习的方式解决问题,而是通过更复杂的反思和回顾过程[45][46] - 基于过程的监督比基于结果的奖励更合理,但实现自动化信用分配面临技术挑战[48][49] 人类学习与AI学习的差异 - 人类学习通过信息操纵和思考实现知识获取,而LLM仅通过预测下一个token学习,缺乏深度思考机制[56] - 人类记忆能力有限反而有利于泛化学习,而LLM过度记忆训练数据可能阻碍认知能力发展[62][63] - 模型崩溃问题源于合成数据训练的局限性,需要保持足够的熵值来维持输出多样性[57][64] AI对经济增长的影响 - AGI将逐步融入经济增长,预计每年带来约2%的GDP增量,但不会以爆发式方式实现[75][76] - AI自动化将首先应用于适合数字化的领域,如呼叫中心等结构化任务,而非复杂的知识工作[78][79] - 编程是AI应用的理想起点,因为代码本质上是结构化的文本,与LLM的技术特性高度匹配[82][83] 技术发展趋势预测 - Transformer架构可能继续演进,但梯度下降训练大型神经网络的基本范式将保持不变[29][30] - 未来技术进步需要算法、数据、硬件等多方面协同改进,而非单一领域的突破[30][74] - 认知核心参数规模可能优化至十亿级别,通过知识蒸馏去除过度记忆,保留核心推理能力[67][70] 实际应用部署路径 - AI部署将采用渐进式自动化策略,人类作为监督者管理多个AI代理,而非完全取代人工[79][80] - 当前AI在经济价值创造上主要集中在编程领域,其他知识工作的自动化进展相对缓慢[82][84] - 超级智能应被视为社会自动化的自然延伸,是计算趋势发展的结果,而非突变式突破[86]
《大模型的第一性思考》李建忠对话GPT5与Transformer发明者Lukasz Kaiser实录
36氪· 2025-10-13 10:46
对话一:语言对于智能到底意味着什么? - 语言模型在智能构建中扮演核心角色,其成功源于对语言在智能中核心作用的认知,ChatGPT和Transformer的成功均得益于此[6][9] - 语言具备时间维度,总是在生成下一个词,而序列模型(如Transformer)可处理包括语言、蛋白质、音频在内的各种序列,时间序列是表达智能的重要组成部分[7] - 语言训练具有实践优势,互联网上海量的语言数据使得训练非常方便且成本远低于视频训练[9] - 语言模型确实会形成独立于语言的抽象概念,例如在解决数学问题时,尽管用不同语言生成答案,但解题方式和错误类型相同,表明模型在抽象空间进行思考[10] - 然而,未经过大量多模态数据训练的模型,其概念(如"痛苦"或"爱")可能与人类植根于物理世界的真实感受有所不同[11] 对话二:多模态与世界模型的挑战 - 现代大语言模型(如GPT-4)已是多模态模型,能接收和生成图像、音频,并已取得巨大进展,例如ChatGPT的语音模式可以对话、唱歌[12] - 当前多模态处理方式(如通过VQ-VAE将图像/音频编码为特殊代码)有效但不令人满意,未来需要更深入地将多模态融合到模型中,使编码更具可训练性并与语言有更多交互[13] - 语言对于为视觉对象赋予语义含义至关重要,否定语言价值的视觉派研究可能重蹈ChatGPT发布前的错误路线[14] - 现代大语言模型在某种程度上已是世界模型,在文本和数学方面表现卓越,但作为物理模型的表现不如语言模型,部分原因是视频训练数据不足、质量不佳及当前架构限制[14] - 通过改进架构、损失函数并增加更好更多的数据,结合像Sora、Genie和Veo这类从视频学习的模型,正在弥合"世界模型"与"语言模型"之间的差距[15] 对话三:AI编程:自然语言是终极目标,还是新的"巴别塔"? - Transformer架构的创造者在早期就已预见其在自动化编程方面的应用潜力[17] - 未来语言模型将能覆盖大量编程工作,但数学符号和编程语言作为沟通工具,在解释复杂概念时比纯自然语言更高效,因此专业程序员仍需掌握这些概念以实现与模型的快速、高效沟通[18] - 编程的重点在于沟通和抽象,而非特定语言,AI有望帮助更好地使用现有编程语言来改进系统,而非必然需要创造新的为AI设计的编程语言[19] - 新的编程语言需求将来自新的计算硬件架构,而非AI编程本身[20] 对话四:Agent的泛化困境:是方法问题,还是根本限制? - 所谓的"智能体模型"通常指在其推理过程中能调用外部工具(如代码解释器、网络搜索)的推理模型,这些模型使用强化学习训练且效果良好[21] - Agent泛化问题的主要挑战在于缺乏学习信号,当模型使用未经训练的工具时,没有像强化学习训练那样的反馈机制来检查答案正确性[22] - 要实现出色的多智能体系统,需要能够模拟整个环境进行训练,而这在当前难以实现,但即使没有大量训练,聪明的模型也能零样本完成许多任务[23] 对话五:算力与算法:Scaling Law是信仰还是路径依赖? - 预训练的Scaling Law已带来巨大进展,但存在经济上的实践极限,因为用户不愿为每个token支付过高费用,且大模型可被蒸馏成更小模型[25] - 预训练的Scaling Law在解决某些问题(如GSM-8K数学数据集)时速度不可行,而强化学习推理能用小模型解决相同问题,显示出更高的数据效率[26] - 推理模型的Scaling Law(通过强化学习让模型运行更长时间以提升性能)受限于Transformer的上下文长度设计以及强化学习在长序列推理中的信用分配问题[27] - 推理的Scaling Law与预训练的Scaling Law有不同限制,这呼唤新的研究和可能的架构或强化学习算法改进[28] 对话六:具身智能的挑战:是数据问题?还是比特和原子的根本性差异? - 具身智能可能更接近于当前的大语言模型,数据效率正在提高,例如推理模型能用极少样本学会困难任务[29] - 实现具身智能需要一个在大量视频上预训练好的多模态模型作为基础,再结合强化学习进行推理训练,但需要调整架构以适应现实世界行动的速度要求[30] - 第一个版本的具身智能模型可能基于现有成果调整,但未来会出现数据和计算更高效的新一代模型[31] 对话七:强化学习:是超级优化器,还是科学发现的引擎? - 由强化学习驱动的推理模型可被视为一种数据效率更高的新架构或范式,能够从有限数据(如1000道数学题)中学习[32][33] - 强化学习只依赖一个奖励信号,若优化得当,模型有望从研究论文中学习并提出连专业人员都觉得新颖的想法,推动科学发现[33] - 该范式仍处于早期阶段(社区广泛关注约一年),需要更多尝试、发现和改进以提升效率和应用范围[34] 对话八:AI的组织跃迁:如何实现大规模Agent协作? - 实现大规模Agent组织(如成千上万个Agent协作)的最大挑战在于开发下一代推理模型,需要类似Transformer之于RNN的架构创新[35] - 当前推理模型顺序生成token的方式缺乏并行性,未来需要为并行过程提供更多信号,并结合新的架构来融入并行处理[36] 对话九:AI记忆的瓶颈:模型离真正的"原生记忆"还有多远? - 通过将记忆作为工具(如访问互联网或记忆库)并结合强化学习训练,模型可以有效地解决记忆问题,当前方案已相当可行[37][38] - 未来可能出现更优雅的记忆机制,如将记忆转化为连续的向量或通过类似LoRA的适配器微调模型权重,但这仍是待研究的问题[40] 对话十:大模型如何摆脱瞬时学习,而像人类一样持续学习? - 利用上下文学习作为持续学习的记忆是当前已实现的进展,模型将对话信息放入上下文进行处理,但效率并非最高[39] - 通过记忆工具和像LoRA这样的适配器微调技术,实质性修改权重已变得更加可行,为持续学习提供了基础,但如何优化算法仍是研究重点[40] - 下一代推理架构有望实现更并行的处理,推动模型在科学发现等领域的应用,未来并不遥远[41]
Want to Win in Any Industry? Grant Cardone Says You Need These 4 Things
Yahoo Finance· 2025-09-23 15:16
核心观点 - 房地产投资者Grant Cardone提出在任何行业取得成功需要具备四个关键特质 这些特质需要长期坚持才能产生有意义的结果 [1] 成功特质 - 第一个特质是拥有成功的渴望 渴望能帮助克服创业过程中的挑战性阶段 并使融入其他特质变得更容易 缺乏渴望将使创业从一开始就面临艰难战斗 [2][3] - 第二个特质是学习的意愿 需要通过学习书籍、视频和播客来了解行业和如何在该行业经营业务 例如仅会烹饪与成功经营餐厅所需的技能完全不同 在业务发展良好时持续学习能发现额外的创收途径 [4][5][6] - 第三个特质是永不放弃的能力 一旦确定可转化为盈利业务的机会就必须坚持 可以放弃已知无效的事物 但对有渴望、持续学习并采取行动接近目标的事情绝不能放弃 克服困难时期将使成功时刻更令人愉悦 [7][8]
外滩大会速递(1):萨顿提出AI发展新范式,强化学习与多智能体协作成关键
海通国际证券· 2025-09-12 02:47
行业投资评级 - 报告未明确给出具体的行业投资评级 [1][2][3][4][5][6] 核心观点 - 图灵奖得主理查德·萨顿提出AI发展正进入"经验时代",强调自主交互与环境反馈为核心,强化学习与多智能体协作是实现该愿景的关键路径 [1] - 当前机器学习多数局限于对人类已有知识的静态迁移,真正能创造新知识的系统需依靠智能体在与环境直接交互中持续生成数据 [1] - 社会对AI偏见、失业及生存风险的担忧被过度放大,应通过多智能体协作机制实现共赢 [1] - 萨顿提出"四条预测原则":价值观多元共存、人类将深入理解并创造智能、超级AI或人机增强系统终将超越人类智力、权力与资源将向最高效智能体集中且"替代"成为必然 [1] - 宇宙演进被划分为粒子、恒星、复制者与设计四个时代,人类核心使命在于推进"设计",AI是迈向"设计时代"不可或缺的动力 [1] 技术范式转变 - 数据定义从静态人类语料转变为动态智能体-环境交互轨迹,意味着学习目标与系统架构的根本重构:从被动拟合数据分布转向主动预测并控制自身观测输入的能力 [2] - AlphaGo自我博弈与AlphaProof生成式推理被视为"经验优先"方法论的有效验证 [2] - 产业落地需将模型从"信息消费"角色转变为可与环境实时交互、闭环试错并持续积累能力的"智能作用体" [2] - 企业需构建具备高频交互、在线评估与能力沉淀功能的智能体运营(Agent-Ops)体系,以实现新知识自动生成与跨任务迁移 [2] 技术瓶颈与研发重点 - 强化学习核心瓶颈并非模型参数规模,而在于时间维度与任务序列处理能力,具体表现为持续学习与元学习两大短板的制约 [3] - 持续学习需克服灾难性遗忘,实现动态表征与非平稳环境中的稳定收敛;元学习要求模型具备跨任务快速迁移与重组能力,训练评估单位需从"样本"升级为"任务" [3] - 这两项能力决定系统是否具备长期演进与泛化复用潜力:缺乏则仅适用于封闭短周期任务,突破则有望在开放环境中越用越强 [3] - 企业研发重心应从追求单点性能突破(SOTA)转向构建长周期评估体系、非平稳任务基准,以及推进记忆机制、规划架构与探索策略的工程化与系统集成 [3] 多智能体协作与治理 - "去中心化协作"不仅是技术架构选择,更是关乎系统治理机制的重要命题,需将机制设计理念引入AI系统工程实践 [4] - 多智能体协作类比市场与政府分工机制,其有效运作依赖明确激励、透明协议及可验证合约的支撑 [4] - 若"权力与资源向最高效智能体集中"成为趋势,需构建三方面基础制度:开放接口与可组合协议防范垄断、合作与对抗并存的博弈测试体系避免激励扭曲、可审计可追溯的责任认定工具量化协作外部性 [4] - 缺乏系统性治理设计,"去中心化"易流于概念,难以实现可持续可信赖的协作生态 [4] 人机协作与组织变革 - AI替代集中于任务层级而非完整岗位,企业应主动推进任务解构与流程重组,系统化布局人机协作体系 [5] - 具体路径包括:制定明确的人机分工框架形成"人类决策—AI探索—AI执行—人类审计"闭环机制、构建经验采集与策略回灌体系将交互数据沉淀为可复用策略资产、改革绩效管理机制以协同效率为导向的KPI替代单一产出指标 [5] - 该体系顺应AI替代带来的效率提升需求,为可持续人机协同提供制度化抓手,有助于企业在智能化转型中保持竞争力和控制力 [5]
外滩大会再证蚂蚁的底色:金融科技公司
每日商报· 2025-09-11 23:04
大会概况 - 2025 Inclusion·外滩大会在上海黄浦世博园区开幕,主题为“重塑创新增长”,来自16个国家和地区的550位嘉宾参会 [1] - 大会聚焦“金融科技”“人工智能与产业”“创新创投生态”“全球对话与合作”“负责任创新与普惠未来”五大内容主线,设置1场开幕主论坛和44场见解论坛 [1] - 大会被誉为“亚洲三大金融科技盛会”之一,以其开放、多元、前瞻性吸引全球目光 [1] 人工智能发展趋势 - 图灵奖得主理查德·萨顿认为人类数据红利正逼近极限,人工智能正在进入以持续学习为核心的“经验时代”,潜力将远超以往 [1][2] - “经验”指的是观察、行动和奖励三种信号的交互,知识来自于经验,智能体的智能程度取决于其预测并控制自身输入信号的程度 [2] - 释放“经验时代”全部潜力需要持续学习(continual learning)和元学习(meta-learning)两项关键技术 [2] - 人工智能被视为宇宙演化的必然下一步 [3] 具身智能与机器人产业 - 宇树科技创始人王兴兴表示,随着大模型发展,AI与机器人结合正催生全新的具身智能产业,目标是让机器人拥有AGI能力 [4] - 当前具身智能发展面临高质量数据及模型算法层面的挑战,但目前被视作大规模爆发性增长的前夜 [4] - 建议年轻创新者忘记过去经验,学习最新知识,全力拥抱新时代,认为创新创业门槛已大幅降低 [4] 金融科技公司动态 - 蚂蚁集团通过战略投资涉足多个科技领域,例如今年6月投资哈啰以切入智能驾驶,并在医疗、智能体和机器人公司背后有深入布局 [5][6] - 支付宝数字政务团队发布全新政务AI助手“晓政”,融合DeepSeek、通义千问、蚂蚁百灵三种大模型 [6] - 蚂蚁数科推出“智能代理合约(Agentic Contract)”,将在其新一代Layer2区块链Jovay上原生部署 [6] - 中国银行保险报联合OceanBase海扬数据库与19家银行编委机构发布报告,指出一体化数据库是中小银行应对系统国产升级与AI规模化落地的“最优解” [6] - 外滩大会上的展示证明蚂蚁是一家纯血金融科技公司,持续走在技术最前沿 [5][6]
对AI的恐惧被夸大了,“强化学习之父”萨顿外滩演讲:四条原则预言AI未来
36氪· 2025-09-11 08:34
AI发展趋势 - 人工智能正在从依赖人类数据的“人类数据时代”进入以持续学习为核心的“经验时代”[1][9] - 当前大多数机器学习方法无法生成新知识且缺乏持续学习能力,这已成为一个非常大的瓶颈[10] - 智能的关键在于学习速度,智商(IQ)等于知识量除以所积累的经验,是衡量学习速度的指标[11] - 经验时代的数据源是智能体以第一人称与世界互动直接生成的观察、行动和奖励信号[13] - 强化学习领域基于“知识来自于经验”的思维方式,智能体的智能程度取决于其预测并控制自身输入信号的程度[14] - 要释放经验时代的全部潜力,需要目前尚不成熟的持续学习(continual learning)和元学习(meta-learning)技术[2][16] AI技术政治影响 - 人工智能已成为高度政治化的议题,是国家地缘政治竞争的焦点,公众担忧其带来偏见、失业甚至人类灭绝[16][18] - 对人工智能的恐惧被夸大,并且是被某些从中获利的组织和个人煽动起来的[2][19] - 在由智能体构成的社会中,目标应是多元的而非唯一的,这类似于经济体系的运行方式[19][20] - 人类最卓越的超能力是协作,这通过语言和货币实现,AI和人类的繁荣将来自于去中心化协作[2][21][22][26] - 去中心化协作是指每个智能体追求自己的目标,并通过互动实现双赢,这比强调共同目标的中心化控制更可持续和强韧[20][24] - 应抵制那些鼓吹不信任、呼吁非协作和中心化控制的呼声,并致力于将协作制度化[27][28] AI哲学意义与未来预测 - 理解智能是科学与人文学科共同追寻的圣杯,AI是人类最古老的追求之一,与人类本性高度相似[31][33] - 提出四条原则来预测AI未来:全球对世界如何运转没有统一意见;人类终将理解并创造出智能;当前人类智能水平将被超级人工智能或增强人类远远超越;权力和资源会流向最聪明的智能体[35][36][37] - 在人类发展进程中,AI的替代是不可避免的[3][38] - 从宇宙视角看,历史可划分为粒子时代、恒星时代、复制者时代(生命时代)和即将到来的设计时代(机器时代)[40] - 人类的独特之处在于“把设计推向极致”,即创造出能自己进行设计的事物,这正是通过AI追求的目标,人类是开启宇宙“设计时代”的先驱[4][42][43] - AI是宇宙演化的必然下一步,应以勇气、自豪和冒险精神来迎接它[6][45]
图灵奖得主理查德·萨顿:人类将开启“宇宙第四大时代”
21世纪经济报道· 2025-09-11 05:45
人工智能发展的现状与局限 - 当前多数机器学习的目标是将人类已有知识转移到缺乏自主学习能力的静态AI上[1] - 行业正逐渐达到人类数据的极限,现有方法无法生成新知识且不适合持续学习[1] - 持续学习对智能的效用至关重要,但现有技术尚不成熟[1][2] 未来发展方向:经验时代 - 行业需要转向新的数据源,即由智能体与世界直接交互生成的经验[1] - 经验被定义为观察、行动和奖励三种信号在智能体与世界间的传递[2] - 知识来自于经验,智能体的智能程度取决于其预测并控制自身输入信号的能力[2] - 强化学习带领行业进入经验时代,但需持续学习和元学习技术释放全部潜力[2] 对人工智能担忧的回应 - 对AI带来偏见、失业甚至人类灭绝的恐惧被夸大,且被某些从中获利的组织煽动[2] - 经济社会的良好运行依赖于个体拥有不同目标和能力,目标不同的智能体可通过去中心化协作实现双赢[2] - 人类最卓越的超能力是协作,经济、市场与政府都是成功协作的产物[2] - 人工智能和人类繁荣将来自于去中心化协作,协作是世间美好事物的源泉[2] 人工智能未来预测原则 - 对世界如何运转没有共识,且没有哪一种看法能凌驾于其他[2] - 人类将真正理解智能并借助技术将其创造出来[2] - 当今人类的智力水平很快将被超级人工智能或超级智能增强的人类超越[2] - 权力和资源会流向最聪明的智能体,人工智能的替代将是不可避免的[2] 人工智能在宇宙演化中的定位 - 宇宙历史分为粒子时代、恒星时代、复制者时代和设计时代,人类目前处于复制者时代[3] - 人类的独特之处在于将设计推向极致,创造出能自己设计的事物,这正是AI追求的目标[3] - 人类是开启宇宙第四大时代“设计时代”的先驱和催化剂[3] - 人工智能被视为宇宙演化的必然下一步,应以勇气、自豪和冒险精神迎接[4]
图灵奖得主理查德·萨顿:人工智能进入“经验时代”,潜力超以往
贝壳财经· 2025-09-11 04:47
人工智能发展现状 - 人类数据红利正逼近极限 大多数机器学习目标是将人类已有知识转移到静态AI [1][2] - 现有方法不能生成新知识 不适合持续学习 而持续学习对智能效用至关重要 [2] - 强化学习带领进入经验时代 需要智能体与世界直接交互生成新数据源 [2] 经验时代技术方向 - 经验指观察 行动和奖励三种信号在智能体与世界间传递 知识来自于经验 [2] - 智能体智能程度取决于预测并控制自身输入信号的程度 经验是一切智能核心 [2] - 释放全部潜力需要持续学习技术和元学习技术 目前这两项技术尚不成熟 [2] 人工智能协作理念 - 对人工智能恐惧被夸大 是被某些从中获利组织和个人煽动 [3] - 目标不同智能体可通过去中心化协作实现双赢 人工智能和人类繁荣将来自去中心化协作 [3] - 人类最卓越超能力在于比其他动物更擅长协作 经济市场与政府都是成功协作产物 [3] 人工智能未来预测 - 对世界如何运转没有共识 没有哪种看法能凌驾其他 [3] - 人类将真正理解智能并借助技术创造出来 [3] - 当今人类智力水平将被超级人工智能或超级智能增强人类远远超越 [3] - 权力和资源会流向最聪明智能体 人工智能替代将不可避免 [3] 宇宙时代与人工智能定位 - 宇宙历史分为粒子时代 恒星时代 复制者时代和设计时代 [4] - 人类独特之处在于把设计推向极致 创造出能自己设计的事物 [4] - 人类是催化剂和助产士 是开启宇宙第四大时代设计时代的先驱 [4] - 人工智能是宇宙演化必然下一步 应以勇气自豪和冒险精神迎接 [4]
图灵奖得主理查德·萨顿2025外滩大会演讲:经验是一切智能的核心与基础
央广网· 2025-09-11 04:06
人工智能发展现状与局限 - 当前大多数机器学习的目标是将人类已有知识转移到缺乏自主学习能力的静态AI上 [2] - 现有方法正逐渐达到人类数据的极限 无法生成新知识且不适合持续学习 [2] - 持续学习对智能的效用至关重要 但现有技术尚不成熟 [2] 人工智能的未来发展方向 - 行业正进入“经验时代” 需要由智能体与世界直接交互生成的新数据源 [2] - “经验”指观察、行动和奖励三种信号在智能体与世界间的传递 是智能的核心与基础 [2] - 强化学习引领了经验时代 但其全部潜力释放依赖持续学习和元学习技术的成熟 [2] 对人工智能未来的预测 - 人类将真正理解智能并借助技术将其创造出来 [3] - 当今人类智力水平将被超级人工智能或超级智能增强的人类超越 [3] - 权力和资源会流向最聪明的智能体 人工智能的替代将是不可避免的 [3] 人工智能的宏观定位 - 人工智能被视为宇宙演化的必然下一步 应以勇气、自豪和冒险精神迎接 [4] - 人类的独特之处在于将设计推向极致 创造出能自己设计的事物 [3] - 人类是开启宇宙第四大时代“设计时代”的先驱和催化剂 [3]