人工超级智能(ASI)

搜索文档
万字长文!首篇智能体自进化综述:迈向超级人工智能之路
自动驾驶之心· 2025-09-11 23:33
自进化智能体综述核心观点 - 大语言模型本质上是静态的 无法在面对新任务 不断进化的知识领域或动态交互环境时调整其内部参数 这已成为开放交互式环境部署的关键瓶颈[2][3] - 自进化智能体代表人工智能领域的范式转变 从扩展静态模型转向开发能够从数据 交互和经验中持续学习与适应的系统 这是通往人工超级智能(ASI)的关键路径[3][4] - 综述首次系统性地围绕三个基础维度组织该领域:进化对象(what) 进化时机(when)和进化机制(how) 为理解与设计自进化智能体提供结构化框架[3][6] 进化对象(What to Evolve) - 智能体系统可分解为四个基本进化支柱:模型(推理和行为参数) 上下文(指令和长期记忆) 工具集(外部技能创建和管理) 以及架构(系统协作结构)[19] - 进化机制涵盖策略 经验 提示 记忆 工具创建与掌握 架构选择等多个维度 不同方法在各维度有不同侧重 例如Mem0在7个维度均有进化 MAS-Zero侧重模型和经验进化[20] 进化时机(When to Evolve) - 按时间阶段分为测试时内自进化(任务执行期间实时适应)和测试时外自进化(任务完成间利用积累经验提升未来表现)[22] - 测试时内进化具有在线性 学习数据动态产生且直接针对当前问题 测试时外进化具有回顾性 作用于历史数据旨在提高任务分布预期性能[23] - 进化依赖三种基本学习范式:上下文学习(ICL) 监督微调(SFT)和强化学习(RL) 在不同时间背景下数据可用性和学习目标存在差异[23] 进化机制(How to Evolve) - 主要方法家族包括基于奖励的进化(标量奖励 自然语言反馈 外部信号) 模仿与示范学习(高质量范例学习) 以及基于群体和进化的方法(选择 变异 交叉等机制)[27] - 不同方法在反馈类型 数据源 奖励粒度 样本效率 稳定性和可扩展性等方面存在显著差异 例如基于奖励的方法对奖励设计敏感 模仿学习受示范质量影响大 群体方法资源密集但可扩展性好[29] 应用场景(Where to Evolve) - 应用系统分为通用领域进化(数字领域各种任务能力扩展)和专用领域进化(特定领域专业知识深化) 前者侧重经验迁移 后者侧重领域深化[31] - 关键应用领域包括自主软件工程 个性化教育 医疗保健和智能虚拟助手等 持续适应和进化在这些领域至关重要[10][38] 评估体系(Evaluation) - 评估需超越传统静态系统 涵盖随时间推移的适应能力 知识积累与保留 长期泛化能力以及技能迁移 同时减轻灾难性遗忘[34] - 现有基准如ScienceAgentBench(102任务) SWE-bench(2,294任务) WebShop(12,087任务)等 在任务领域 核心指标和时空范围上各有侧重[36] - 个性化评估需开发更轻量级 适应性指标和动态基准 传统ROUGE和BLEU等指标无法充分捕捉动态进化特性[39] 技术挑战与研究方向 - 泛化能力面临专业化与广泛适应性矛盾 需可扩展架构设计 跨领域适应技术(测试时扩展 推理时适应)以及持续学习与灾难性遗忘解决方案[40][42] - 安全与可控性需应对用户相关风险和环境风险 通过智能体宪法 安全训练算法和隐私保护措施实现平衡部署[43][44] - 多智能体生态系统需平衡个体与集体推理 开发高效算法和自适应框架 并建立动态评估基准反映持续适应和演变交互[45]
一家芯片“新”巨头,横空出世
半导体行业观察· 2025-08-21 01:12
核心观点 - 软银正通过大规模资本运作构建完整的AI算力产业链 从IP到应用层进行全面布局 目标是成为全球第一的ASI平台提供者[5][9][23] - 公司采取"跨资产集成"策略 通过投资和收购在半导体制造 CPU AI加速器 数据中心和大模型等关键环节建立影响力[23][34][35] - Arm是战略核心 其IP授权模式提供稳定现金流 且正通过自研芯片强化数据中心领域话语权[26][28][31] 财务数据 - 截至2025年6月26日 软银净资产价值约31万亿日元 市值约14万亿日元 约为资产价值的一半[4] - Arm在2024财年实现40.07亿美元创纪录收入 同比增长25.3% 其中专利收入增长22.7%至21.68亿美元[30] - 全球基于Arm的芯片累计出货量超过3250亿个 预计2025年超大规模提供商50%新服务器芯片将基于Arm架构[28] 战略投资布局 - 向英特尔投资20亿美元 成为其前十大股东 支持其系统代工+AI战略并布局美国本土制造[13] - 领投OpenAI高达400亿美元融资 分两期投入 先投100亿美元 年底追加300亿美元[16][19] - 以65亿美元收购Arm服务器CPU厂商Ampere 补齐CPU自主可控缺口[20] - 收购英国AI芯片公司Graphcore 获得差异化IPU技术路径[21] - 联合OpenAI和Oracle推动Stargate项目 规划投资规模达5000亿美元 在俄亥俄州与富士康合作建设超级数据中心设备产线[14] 产业链整合 - 构建从IP Arm → CPU Ampere → AI加速 Graphcore/NVIDIA → 制造 Intel Foundry → 数据中心 Stargate → 应用 OpenAI 的完整算力栈[23][26][27] - Arm商业模式具有长尾效应 约50%专利收入来自10年前推出的产品 为AI扩张提供稳定现金流[30] - Arm启动自研芯片计划 挖角亚马逊AI芯片负责人 可能推出面向数据中心的整芯片产品[31] 竞争策略 - 区别于英伟达的技术闭环模式和云厂商的垂直整合模式 软银采取跨资产集成策略 通过资本运作聚合各环节最优资源[34][35] - 在Arm/NVIDIA/Intel Foundry等多个生态同时布局 以多点影响替代单点自研[34] - 将社会化生产要素重新组织 在应用层通过OpenAI实现收口 争夺系统集成权[35]
扎克伯格的“星辰大海”:从元宇宙到超智能的赢面到底有多大?
虎嗅· 2025-08-20 07:37
战略转型 - 公司战略重心从元宇宙转向人工超级智能 旨在为全球数十亿用户提供个人超智能系统 [3][4][5] - 该战略被描述为高风险高回报的豪赌 涉及数百亿美元投入和内部组织调整 [1][3] 资本投入 - 2025年资本支出预计达660-720亿美元 大部分用于AI基础设施建设 [6] - 投入方向包括自研芯片和千兆瓦级数据中心(普罗米修斯/海伯利安) [6][7] 技术挑战 - 超过66%训练中断由硬件故障引起 包括SRAM/HBM和网络交换机问题 [7] - 大规模同步训练环境对系统稳定性提出极高要求 [7][8] 开放战略 - 通过Llama系列开放权重实施商品化互补品策略 刺激对云服务和广告需求 [9][10][11] - 但存在为竞争对手做嫁衣风险 下一代Behemoth模型可能转向封闭策略 [12] - 月活超7亿产品需申请商业许可 实际为开放权重而非完全开源 [13][14] 广告业务 - AI广告工具实现自动化创建与精准定位 ROAS提升12% [16][17][18] - Ben & Jerry's案例显示点击率提升7% 单次点击成本降低6.5% [18] - 视频观看总时长同比增长超20% [18] 消费者产品 - AI助手月活超4亿 但市场份额远低于ChatGPT(60.4%)和Gemini(13.5%) [20][21] - 被用户认为缺乏个性化和跨应用记忆 体验像半成品 [21] 元宇宙与硬件 - Horizon Worlds仅20-30万用户 远逊于VRChat(1000万)和Roblox(7770万日活) [22] - 智能眼镜实现语音交互和视觉识别 延伸至可穿戴设备领域 [22] 人才战略 - 高价挖角引发内部士气危机 被视作对现团队的否定 [24][25] - 半年内进行四次重组 新成立超智能实验室分为四个小组 [26][27] - 竞争对手评价其以天价雇佣资质平平的科学家 [27] 系统层级缺陷 - 缺乏自主操作系统 无法像Google/Apple进行系统级AI集成 [28][29] - 导致AI助手功能受限 难以获取全面用户数据 [29] 隐私与合规 - 用户私人查询被意外公开 包括医疗敏感信息 [30][31] - 部分平台缺少端到端加密 面临得州和欧盟监管调查 [32][33] - 计划用AI取代90%人工风险评估 可能加剧伦理风险 [33]
从物竞天择到智能进化,首篇自进化智能体综述的ASI之路
机器之心· 2025-08-12 09:51
自进化智能体综述核心框架 - 普林斯顿大学联合多所顶尖机构发布首个系统性自进化智能体综述,旨在建立统一理论框架并为实现通用人工智能(AGI)和人工超级智能(ASI)铺平道路 [2] - 提出围绕"What、When、How、Where"四个维度的完整分析框架,系统梳理前沿技术 [8] - 将智能体系统解构为四大核心组成部分:架构(Γ)、模型({ψi})、上下文({Ci})和工具集({Wi}) [9] - 自进化策略被形式化为转换函数f,输入当前智能体系统(Π)、轨迹(τ)和反馈(r),输出演化后的新系统(Π'),即Π' = f(Π, τ, r) [9] - 终极目标是构建最优自进化策略f,使智能体在连续任务上的累积效用最大化 [9] 演化内容(What to Evolve) - 模型演化包括决策策略优化(如通过自我生成挑战性任务SCA或自然语言反馈在线微调SELF、TextGrad)和经验积累学习(如Reflexion自我反思机制、RAGEN强化学习框架) [13] - 上下文演化涵盖记忆动态管理(如Mem0框架的ADD/MERGE/DELETE机制、Expel提炼可泛化规则)和指令提示自动化优化(如APE候选提示生成、DSPy可微分程序联合优化、MASS多智能体通信优化) [13] - 工具演化分为自主创造新工具(如Voyager探索式学习、Alita响应式代码生成)、已有工具精通(如LearnAct自我纠错循环)以及管理与选择(如ToolGen工具调用生成问题、AgentSquare元学习优化组件配置) [13] - 架构演化针对单智能体(如TextGrad优化工作流节点、Darwin Gödel Machine重写自身源代码)和多智能体系统(如AFlow蒙特卡洛树搜索协作流程优化、ReMA多智能体强化学习协同策略) [14] 演化时机(When to Evolve) - 测试时自进化发生在任务执行期间,例如AdaPlanner通过ICL动态修正计划、利用"self-edits"指令触发即时SFT更新模型权重、LADDER框架通过RL实现即时技能获取 [20] - 测试间自进化发生在任务执行之后,例如STaR和SiriuS通过SFT从成功或失败推理链生成训练数据实现自举式提升、RAGEN和WebRL利用RL在任务间歇期优化策略 [20] 演化方法(How to Evolve) - 基于奖励的演化利用文本反馈(如Reflexion提供自然语言改进建议)、内部奖励(如CISC利用模型置信度自我评估)、外部奖励(如工具执行成功/失败)和隐式奖励(如从模型logits提取内生奖励函数) [21] - 模仿与演示学习通过自我生成演示(如STaR)、跨智能体演示(如共享经验库学习)或混合方式学习高质量范例 [21] - 基于种群的演化方法维护多个智能体变体或团队,通过选择、变异和竞争机制探索解空间,例如Darwin Gödel Machine的开放式代码进化、EvoMAC的文本反向传播机制 [22] 应用场域(Where to Evolve) - 通用领域演化通过记忆机制(如总结历史经验形成可复用知识)、模型-智能体协同进化(如奖励模型与世界模型相互促进)和课程驱动训练(如WebRL自适应生成难度任务)拓展广泛任务能力 [25] - 特定领域演化在垂直领域深耕,例如编码领域SICA自主修改代码库、GUI领域通过真实交互学习界面操控、金融领域QuantAgent优化量化策略、医疗领域Agent Hospital提升诊断能力、教育领域PACE个性化调整教学策略 [25] 评估范式 - 提出五大评估目标:适应性(Adaptivity)、知识保留(Retention)、泛化性(Generalization)、效率(Efficiency)和安全性(Safety) [28] - 评估模式分为静态评估、短时程自适应评估和长时程终身学习评估 [28] - 适应性通过迭代步骤成功率(如65、29、247项研究)和适应速度(如Voyager)衡量;知识保留通过遗忘率(FGT)和反向迁移(BWT)衡量;效率通过Token消耗、时间支出和工具生产率衡量;安全性通过安全评分、危害评分和泄漏率等衡量 [29] - 代表性基准测试包括ScienceAgentBench(102项科学数据分析任务)、SWE-bench(2,294项软件工程任务)、OSWorld(GUI任务)、LifelongAgentBench(1,396项长时程任务)和AgentBench(1,360项通用任务) [31]
对话凯文·凯利:不必过多担忧,AI变强后,人类只需专注于“玩”
36氪· 2025-08-01 10:55
AI技术发展趋势 - 当前AI模型扩展规模面临困难 新模型缺乏革命性突破 包括中国模型与美国模型相比仍无明显差异[3] - 实现通用人工智能需要超越现有扁平化模型架构 智能是包含几十种不同元素的复杂化合物[4] - 智能不是单一维度 而是多维度的广阔空间 需要建立"可能心智的分类学"来标示各类智能体的位置[9] 异类智能概念 - 用"异类智能"替代AGI/ASI概念 强调AI不是高于人类的超级智能 而是不同于人类的"他者"[6][7] - 智能无法在所有维度都优化 就像蚂蚁在某些能力上优于人类 AI也将专注于不同领域而非全能[12][13] - 需要同时准备两种场景:大型通用模型成功路线与去中心化小众模型路线[15] 镜像世界技术 - 镜像世界是叠加在现实世界的虚拟维度 包含VR体验、真实世界孪生、空间智能和机器认知四个层面[16][17] - 镜像世界需要廉价普及的AI支持 通过实时处理真实世界数据构建虚拟环境[18] - 主要用途是协作工具而非娱乐 能实现百万人规模实时协作 超越现有通讯方式限制[20][21][22] AI行业竞争格局 - AI行业将形成自然垄断格局 遵循网络效应"越大越好 越好越大"的规律[26] - 垄断地位生命周期较短 新平台会快速取代旧主导者 如OpenAI可能取代谷歌搜索地位[27] - 当前主导企业可能被新兴AI公司取代 镜像世界平台将带来新一轮洗牌[27] 人类价值定位 - 人类拥有AI不具备的"大写的创造力" 能突破性创新而非仅优化现有方案[29] - 人类存在本身将变得稀缺且有价值 富人更愿被真人包围 人性成为稀缺品[35] - 人类将通过提供陪伴、教学等"做人"服务获得收入 即使AI能完成经济价值更高的工作[35] 数据与隐私 - 用户愿意用隐私换取个性化服务 会自主选择开放透明度以获取AI助理的更大价值[38] - 信任是关键因素 不同地区用户对政府或企业的信任度将决定数据开放意愿[38] 教育体系变革 - 核心技能是"学会如何为自己学习" 需要掌握优化自身学习方式的能力[41] - 学校教育应关注学习能力本身而非特定科目 采用自定进度个性化教学[42] - 提问能力比知识掌握更重要 学会提问是优化学习的关键方法之一[43]
万字长文!首篇智能体自进化综述:迈向超级人工智能之路~
自动驾驶之心· 2025-07-31 23:33
自进化智能体综述核心观点 - 自进化智能体是AI领域从静态模型转向动态持续学习的关键范式转变 旨在解决LLMs在开放环境中无法实时调整参数的瓶颈问题 [2][3][5] - 研究围绕三大基础维度构建框架:进化对象(模型/记忆/工具/架构)、进化时机(测试时内/外)、进化机制(奖励/反馈/搜索等) [2][6][21] - 该领域首次系统性梳理了自进化智能体的算法、评估指标和应用场景 为人工超级智能(ASI)的实现提供路线图 [3][6][52] 进化对象(What to Evolve) - **模型进化**:通过参数微调(SFT/RL)实现推理和行为优化 如AgentGen支持策略网络动态更新 [22][24] - **记忆进化**:长期记忆模块(如Mem0)可存储历史交互数据 支持经验复用和知识迁移 [24][29] - **工具进化**:智能体自主创建/掌握新工具(如Voyager生成代码工具)以扩展能力边界 [24][42] - **架构进化**:单智能体向多智能体系统扩展(如MAS-Zero) 通过协作提升复杂任务处理能力 [24][159] 进化时机(When to Evolve) - **测试时内进化**:任务执行中实时调整(如通过ICL) 典型场景包括动态环境交互和即时错误修正 [25][26][27] - **测试时外进化**:任务间隙离线优化 含监督微调(SFT)和强化学习(RL)两种范式 需平衡计算成本与长期收益 [26][28][33] 进化机制(How to Evolve) - **奖励驱动**:利用标量奖励(如TextGrad)或自然语言反馈引导进化 需注意奖励稀疏性问题 [31][32][36] - **模仿学习**:通过高质量示范(人类/智能体生成)快速提升能力 但依赖数据多样性 [32][36] - **群体进化**:多智能体系统(如AlphaEvolve)采用选择/变异机制 促进策略创新但计算成本高 [32][36][61] 应用场景 - **通用领域**:编程(Voyager自动生成代码)、教育(个性化学习助手)等数字环境任务 [38][42] - **专业领域**:医疗(WIN-GPT电子病历分析)、科研(文献自动归纳与实验设计)等高专业性场景 [43][47] 未来挑战 - **个性化进化**:需解决冷启动问题 开发轻量级评估指标以跟踪长期用户偏好适应 [43][44] - **安全可控性**:构建"智能体宪法"框架 防止有害行为生成和隐私泄露 [49][50] - **多智能体协同**:平衡个体推理与群体决策 开发动态评估基准反映长期交互效应 [51]
OpenAI反挖四位特斯拉、xAI、Meta高级工程师,目标星际之门
机器之心· 2025-07-09 04:23
AI行业人才争夺战 - Meta近期从OpenAI挖走至少7位员工并提供高薪酬和充足算力资源 [8] - OpenAI从特斯拉、xAI和X公司挖来4位知名工程师包括特斯拉前软件工程副总裁David Lau [3][5] - 被Meta挖走的OpenAI研究者已达8位可能加入Meta新组建的超级智能实验室 [18] OpenAI的战略布局 - OpenAI扩展团队负责管理后端硬件与软件系统及数据中心包括"星际之门"超级计算机项目 [7] - "星际之门"计划将包含百万块专用AI芯片预计成本达1150亿美元 [7] - 公司强调基础设施对实现通用人工智能(AGI)使命的关键作用 [7] 行业竞争态势 - AI行业自2022年底ChatGPT推出后人才争夺战异常激烈 [13] - 各大公司为率先实现人工超级智能(ASI)重新反思常规人才招聘规范 [14][15] - 扩展能力(scaling)对AI发展起关键作用更多数据和算力使模型更强大 [16][17] 公司间关系动态 - OpenAI从xAI挖人可能加剧与马斯克的紧张关系 [10] - 马斯克2018年退出OpenAI后现正起诉公司背弃初衷 [11] - OpenAI反诉马斯克指控其存在不正当竞争并干扰公司运营 [12] 人才流动影响 - OpenAI首席研究官Mark Chen表示要在顶尖研究人才争夺战中与Meta正面交锋 [19] - 公司可能调整研究人员薪酬方案以更好应对竞争 [8] - Meta挖角目标还包括Thinking Machines Lab多位员工 [9]