通用人工智能(AGI)

搜索文档
奥特曼的人设,塌在GPT-5
虎嗅· 2025-08-16 11:03
核心观点 - OpenAI CEO山姆·奥特曼在AGI定义和GPT-5宣传上存在前后矛盾,引发公众和投资人质疑 [4][5][6] - 奥特曼被指存在"撒谎微表情",其营销风格导致用户信任度下降 [7][8][9][10] - OpenAI商业模式和承诺频繁变动,从反广告到考虑广告收入 [18] - 公司内部管理问题曝光,包括资源分配混乱和高管内斗 [25][26] - 行业竞争加剧,OpenAI领先优势被蚕食,面临Anthropic、Google等对手挑战 [34][36] AGI定义争议 - 奥特曼半年内对AGI重要性表述出现多次反转,从"AGI即将到来"到"AGI术语无用" [2][3][4] - 其关于AGI的表述刻意保留退路,如"传统意义上的AGI"而非明确承诺 [16][17] - 定义模糊化导致外界对OpenAI技术路线产生困惑 [5] GPT-5营销翻车 - 产品预热采用神秘化手法(如"眩晕无力"描述),最终效果未达预期 [10] - Polymarket投票显示OpenAI支持率从75%暴跌至14% [15] - 网友发现奥特曼谈论GPT-5时出现疑似撒谎的微表情(抬头动作) [7][8][9] 商业模式变动 - 从公开反对广告到考虑"点击交易收入"模式 [18] - 早期承诺"非营利性"和"开源"未兑现,实际保留代码所有权 [11] - 付费商业用户从6月300万增至500万,显示商业化加速 [12] 公司管理问题 - 董事会指控奥特曼未坦诚沟通,涉及基金所有权和安全流程信息 [23][24] - 被前高管批评采用"心理虐待"管理风格,制造团队内斗 [25][26] - 历史争议包括与马斯克决裂时利用理念分歧获取控制权 [28] 行业竞争格局 - ChatGPT周活用户达7亿但面临Google等对手技术追赶 [12][13] - 核心人才外流,xAI、Anthropic等竞争者崛起 [34] - 行业需要多元技术路线而非单一公司主导 [36][37] 创始人形象影响 - 品牌高度依赖个人形象,信任坍缩速度快于技术迭代 [31] - 与乔布斯类比显示"现实扭曲力场"但缺乏持续成功支撑 [32][33] - 早期YC时期已显现权力掌控特质 [29]
AI竞赛愈演愈烈,Meta六个月内第四次重组AI团队
凤凰网· 2025-08-16 09:21
Meta AI团队重组 - 公司计划全面重组人工智能工作团队 这是过去六个月内第四次全面改革 [1] - 新成立的超级智能实验室将被分为四个小组:TBD实验室 产品团队 基础设施团队 基础人工智能研究(FAIR)实验室 [1] - 超级智能实验室于7月初成立 整合原有AI业务 目标开发超越人类能力的AI系统并推动通用人工智能(AGI)研究 [1] - 实验室由Alexandr Wang担任首席人工智能官 Nat Friedman担任联合负责人 [1] Meta在AI领域的战略布局 - 公司近期动作频繁 表明其正全力以赴加快通用人工智能研发 [2] - 计划斥资数千亿美元建设多个大型人工智能数据中心 [2] - 邀请PIMCO和Blue Owl Capital牵头为路易斯安那州数据中心扩张提供290亿美元融资 [2] - 以巨额薪酬在硅谷"挖角"招聘其他公司AI研究人员 [2] - 将年度资本支出预测下限上调20亿美元至660-720亿美元 [2] - 数据中心建设成本和员工薪酬成本上升将推动2026年费用增长率超过2025年 [2]
麻省理工大学:《通往通用人工智能之路》的研究报告
欧米伽未来研究所2025· 2025-08-15 06:45
通用人工智能(AGI)发展现状 - AGI定义为实现经济价值领域超越人类的全自主系统 但专家认为需涵盖更广的智能维度如适应性重组能力[4] - 当前AI在专业领域(药物发现 代码编写)表现优异 但解决基础谜题能力远逊人类 显示认知鸿沟[2] - 最先进大型语言模型在ARC-AGI-2基准测试得分为0% 而人类接近满分 凸显适应性缺陷[4] AGI实现时间表加速 - GPT出现前AGI预测需80年 GPT-3发布后缩短至50年 2024年底预测进一步骤降至5年[3] - 行业领袖预测: Anthropic联合创始人认为"强大AI"可能2026年出现 具备跨界面自主推理能力[3] - 综合预测显示50%概率2028年前实现多项AGI里程碑 2047年机器全面超越人类概率达50%[4] 技术瓶颈与突破路径 - 计算能力需求: AGI可能需要超10^16 teraflops 2037年计算成本或超美国GDP[5] - 深度学习时代计算量翻倍时间从21个月缩短至5.7个月 需转向高效异构计算架构[5][6] - 硬件创新需结合CPU/GPU/NPU/TPU 配套软件工具实现跨平台代码运行[7] - 根本性障碍在于智能定义本身 需突破概率图谱技术基础 寻求类似Transformer的架构革命[7][8] 智能本质的重新定义 - 需建立超越人类成就的新框架 纳入流体智能/社交智能/具身智能等维度[8] - 智能被重新定义为"有效重组已知事物解决新问题的能力" 当前AI缺乏此核心特质[4] - 视觉感知/精细运动/创造力/情感互动等8项人类能力仍是AI显著短板[5] 行业生态发展趋势 - OpenAI CEO认为AGI将引发堪比电力/互联网的社会变革 创造超指数级社会经济价值[3] - 实现路径需硬件/软件/算法/定义的四重革命 形成统一生态系统[8][9] - 麦肯锡数据显示当前AI在色彩一致性/上下文理解/同理心等方面存在明显不足[5]
DeepMind CEO定义世界模型标准:不仅理解物理世界,还能创造它
36氪· 2025-08-14 01:57
DeepMind技术突破与战略布局 - 公司近期密集发布包括Deep Think、Genie 3等约50个项目,研发节奏显著加快,成果覆盖数学奥赛金牌、世界模型生成等领域 [3] - 世界模型Genie 3实现突破性进展,生成虚拟世界具备物理一致性(如水流、倒影等),验证了底层物理理解能力 [1][8][9] - 终极目标是开发融合语言、多媒体、物理推理的"全能模型"(Omni Model),推动AGI安全落地 [2][18] 思考型模型与AGI演进路径 - "思考型模型"通过叠加规划能力实现多路径并行推演与自我修正,是AGI核心路径 [3][4][7] - 模型能力呈现"参差型智能":可生成完整虚拟宇宙但可能在国际象棋中违规,反映推理与一致性短板 [1][12] - 早期游戏AI(如AlphaGo)奠定智能体系统基础,当前多模态模型已扩展至语言、物理等多领域 [3][7] Genie 3的应用前景 - 作为训练平台:支持AI智能体(如SIMA)在生成世界中执行任务,创造无限训练数据 [10] - 娱乐创新潜力:可能催生电影与游戏融合的新形态,公司透露长期布局游戏领域计划 [10][21] - 科学价值:生成世界的物理一致性为现实本质研究提供新视角 [11] 行业技术挑战与评测体系 - 现有评测基准(如AIME数学测试)接近饱和(Deep Think达99.2%),需开发覆盖物理直觉、安全性等的新评估体系 [13] - "游戏竞技场"成为重要评测场景,延续游戏AI传统优势,未来或引入AI自创游戏对战 [13] - 工具调用能力成为新扩展维度,需经验性平衡内化能力与外部工具使用(如数学程序、搜索引擎) [15][16] 开发者与产品化方向 - 建议开发者聚焦高价值工具构建,产品设计需预判1年后技术状态并支持3-6个月重大更新 [17] - 模型向系统进化:工具调用与规划能力结合可能带来指数级能力扩展 [17] - 网络生态将因智能体系统灵活使用工具发生根本性变革 [18]
Lisa Su最新专访:谈GPU、DeepSeek和AI展望
半导体行业观察· 2025-08-14 01:28
公司业绩与战略 - AMD在苏姿丰领导下市值从20亿美元飙升至近3000亿美元 [5] - 数据中心收入从2022年60亿美元增长到2023年126亿美元 [15] - 采用小芯片技术并推出全球首款7纳米数据中心GPU [6] - 与OpenAI、Meta、谷歌、特斯拉等巨头达成合作 [6][16] 行业竞争格局 - AMD与英伟达在AI芯片市场直接竞争 [3][7] - 英伟达市值达4.4万亿美元远超AMD [7] - 特朗普政府对销往中国芯片征收15%关税 [3] - ROCm软件生态系统与英伟达CUDA存在差距 [19] 技术发展方向 - 人工智能从训练转向推理计算 [18] - 模块化芯片制造方法获得巨大回报 [6] - 医疗保健被视为AI关键应用领域 [22][31] - 预计未来三四年市场规模超5000亿美元 [16] 产业政策与布局 - 支持芯片制造回归美国 [11] - 台积电亚利桑那晶圆厂已运行最新服务器处理器 [12] - 半导体产业对国家安全和经济利益至关重要 [11] - 需要改变追求最低成本的心态 [12] 产品与研发 - 针对内存容量等推理计算关键因素优化 [18] - 拥有AI模型团队进行产品测试 [19] - 通过收购Nod.ai加强软件生态系统 [22] - 微软将在云服务中全面采用AMD芯片 [17]
“一轮融资近600亿,凶悍的全球第三大独角兽”
搜狐财经· 2025-08-14 00:43
融资与估值 - 公司完成83亿美元战略投资轮融资 投后估值达3000亿美元 折合人民币2 2万亿元 成为全球第三大独角兽 仅次于SpaceX和字节跳动 [1] - 本轮融资主要用于扩建AI算力集群 模型训练和推理成本 以及潜在并购 与400亿美元长期融资计划相配套 [1] - 领投方Dragoneer Investment Group单笔出资28亿美元 创下单一LP对初创企业的出资纪录 [2] - 跟投方包括黑石 TPG 富达 红杉等十余家机构 获得约5倍超额认购 优先引入新战略投资人 部分老股东额度被压缩 [2] 投资方与历史融资 - 初期启动资金来自马斯克 Altman等10亿美元捐赠承诺 2019年设立有限盈利子公司后获微软首笔10亿美元投资 [3] - 后续融资方包括老虎环球 a16z 微软 软银等 微软累计投资4次 并在管理层变动中力挺CEO Sam Altman [3] - 软银曾计划牵头年初400亿美元融资轮次 3000亿美元估值当时已提出 [3] 产品与市场表现 - 旗下产品ChatGPT于2022年上线 创下5天用户破百万 2个月破亿的纪录 成为人类历史上增速最快的消费级应用 [5] 公司背景 - 2015年由Sam Altman 马斯克等9人创立 初衷为确保通用人工智能造福全人类 最初定位为非营利研究实验室 [2] - 马斯克因利益冲突于2018年退出董事会 [3]
AI迎来关键转折,空间智能爆发临界点已至?
36氪· 2025-08-13 10:39
空间智能的定义与重要性 - 空间智能是人工智能理解、生成、推理并与三维世界交互的能力,是人类和动物智能的核心,历经5.4亿年进化完善,而语言进化仅用不到百万年[1] - 空间智能是感知世界和与物理环境互动的基础,对机器人、智能辅助驾驶、虚拟现实和内容创作等领域不可或缺[1] - 中国工程院院士倪光南指出,AI与空间智能融合是落实国家"人工智能+"行动的关键技术,正在重构三维物理世界并拓展大模型通向物理世界的桥梁[3] 空间智能的技术挑战 - 空间智能开发比语言处理复杂,语言是线性一维的,而三维世界充满动态性和物理规律,从2D图像重建3D结构是数学上的"病态"问题,存在多种解法[6] - 语言数据在互联网上随处可见,但空间数据大多存在于感知中难以直接获取,数据稀缺性带来巨大挑战[6][7] - 维度复杂性挑战:语言是一维序列,现实世界是三维空间与一维时间结合,组合复杂性呈指数级增长,计算需求远超语言模型[6] - 信息获取非适定性挑战:从2D图像重建3D信息需要模拟人类的多模态感知能力[6] - 生成与重建二元性挑战:空间智能系统必须同时具备生成虚拟世界和重建真实物理世界的能力,要求算法遵守物理规律并捕捉细节[6] 空间智能的五层技术框架 - 第一层:底层三维属性重建,包括深度感知、相机定位、点云构建与动态跟踪等基础组件[8] - 第二层:三维场景组成要素重建,包括人物、物体和建筑结构等元素的几何重建,神经辐射场和3D高斯点云等技术实现高度真实感细节还原[9] - 第三层:完整的4D动态场景重建,引入时间维度构建动态表征系统,分为通用场景4D重建和人体运动专项建模[9] - 第四层:场景内部组成部分交互关系重建,建立场景元素间动态交互模型,重点研究人体与物体运动关联[10] - 第五层:引入物理规律和约束条件,整合重力、摩擦等基础物理规律,扩展至物体形变和碰撞检测等复杂物理现象[10][11] 行业应用与案例 - 自动驾驶领域:空间智能帮助辅助驾驶系统预测车辆行人行为并调整行车策略,提高安全性与效率[12] - 日本东京进行3D数字孪生化,绝对位置精度10cm以内,包含LiDAR点云和实时交通数据,预计2030年实现完整数字孪生城市[15] - 中国MogoMind模型整合车辆轨迹和交通流量等数据,具备六大关键能力:实时全局感知、物理认知理解、通行能力推理计算、最优路径规划、数字孪生和风险预警[16] - 医疗领域:空间智能对CT、MRI等影像数据进行三维重建分析,帮助医生更准确诊断疾病并提供手术导航[17] - 数字孪生城市提供实时反馈并随城市动态调整状态,使城市管理更加灵活高效,如新南威尔士州通过该技术实时调整交通减少拥堵[16] 技术演进与未来展望 - 空间智能代表AI领域崭新思维方式,将感知信息转换为外部环境抽象模型,使智能体能够预测和理解世界动态变化[12] - 空间智能是AI从"自发感知"走向"自主认知"的迈进,突破信息空间局限向真实三维世界扩展[12] - 英伟达科学家Jim Fan表示未来城市管理将依赖实时图形引擎中的模拟和集群系统,使机器人能快速适应复杂环境[16] - 通过高精度模拟环境训练,机器人能获得丰富训练数据并在复杂场景中快速学习,推动从虚拟到现实世界的顺利迁移[16]
OpenAI联合创始人Greg Brockman:对话黄仁勋、预言GPT-6、我们正处在一个算法瓶颈回归的时代
AI科技大本营· 2025-08-13 09:53
行业演进与公司发展 - 计算机行业正经历从个人魔法到工业革命的演进,OpenAI驾驭十万GPU集群标志着AI基础设施的成熟[3] - Stripe早期通过第一性原理突破传统限制,24小时完成银行需9个月的技术对接,体现硅谷创新精神[15][16] - OpenAI构建了研究-工程双引擎文化,工程能力与研究洞见同等重要,共同推动AGI发展[27][28][29] 技术突破与创新 - 深度学习从AlexNet开始颠覆传统规则,神经网络在多个领域超越人类设计的系统[24][25] - 强化学习(RL)和混合专家模型(MoE)成为解决算法瓶颈的关键方向,推动AGI研究进入新阶段[49][48] - Codex已贡献OpenAI内部10%代码合并请求,外部GitHub日处理24000个PR,重塑软件开发流程[42] 基础设施与硬件需求 - AI基础设施需兼顾高计算量任务与低延迟响应,催生专用加速器需求[45][47] - 模型规模扩大带来系统复杂性挑战,检查点机制和可靠性设计成为训练长周期智能体的关键[43][44] - 黄仁勋提出未来数据中心需支持多样化工作负载,包括多模态AI和实时交互系统[45][46] 产品化与生态发展 - AI产品化面临模型与产品的鸿沟,需结合领域专业知识构建垂直智能体生态[52][53] - GPT-4o图像功能5天获1亿用户,反映AI应用病毒式传播特性与规模化挑战[35][36] - 经济将因AI驱动产生10倍增长,医疗、教育等领域需定制化解决方案[54][55] 研发趋势与瓶颈 - 基础研究回归成为核心,算法瓶颈重新成为制约AGI进展的关键因素[49][50] - 当前研发受计算资源、数据、算法、电力等多维度限制,需动态平衡[49] - GPT-4暴露可靠性问题,显示AI需突破"隔玻璃观察"的学习模式[50][51]
凯德北京投资基金管理有限公司:软银全力投入ai,能否再造一个奇迹?
搜狐财经· 2025-08-12 12:37
孙正义的AI战略愿景 - 软银创始人孙正义将公司战略重心转向人工智能领域,目标是打造"超人工智能"(ASI),并预言ASI将在未来十年内实现[1] - 孙正义将实现ASI视为个人使命,这种信念驱动软银近年来的重大投资决策[3] - 软银的AI战略覆盖半导体、软件、基础设施、机器人、云服务等多个维度,目标是构建深度整合的AI生态系统[3] 软银的AI投资布局 - 2016年以320亿美元收购Arm,目前估值已升至1450亿美元,Arm正从智能手机芯片转向AI基础设施领域[3] - 2024年3月以65亿美元收购Ampere Computing,强化AI硬件布局[3] - 计划向OpenAI注资约327亿美元,这是继微软之后对该企业的又一笔重大投资[3] 历史背景与战略调整 - 孙正义对AI的远见可追溯至2010年提出的"脑计算机"概念,2014年推出情感机器人Pepper展现前瞻性思考[5] - 2017年成立的Vision Fund曾因投资Uber、滴滴和WeWork等企业而受争议,当时认为自动驾驶是AI首个落地场景但市场成熟度低于预期[5] - 2019年试图投资OpenAI未果,现Vision Fund已全面转向AI领域投资[5] 行业竞争格局 - 中美科技巨头竞逐"通用人工智能"(AGI)制高点,新兴企业不断涌现,如中国企业深度求索推出低成本推理模型[7] - 晨星分析师指出软银投资的AI领军企业技术仍处早期阶段,潜在挑战者可能随时出现[7] - 软银正推动成为"AI时代的核心玩家",从阿里到Arm再到AI全产业链布局的战略延续[7]
从物竞天择到智能进化,首篇自进化智能体综述的ASI之路
机器之心· 2025-08-12 09:51
自进化智能体综述核心框架 - 普林斯顿大学联合多所顶尖机构发布首个系统性自进化智能体综述,旨在建立统一理论框架并为实现通用人工智能(AGI)和人工超级智能(ASI)铺平道路 [2] - 提出围绕"What、When、How、Where"四个维度的完整分析框架,系统梳理前沿技术 [8] - 将智能体系统解构为四大核心组成部分:架构(Γ)、模型({ψi})、上下文({Ci})和工具集({Wi}) [9] - 自进化策略被形式化为转换函数f,输入当前智能体系统(Π)、轨迹(τ)和反馈(r),输出演化后的新系统(Π'),即Π' = f(Π, τ, r) [9] - 终极目标是构建最优自进化策略f,使智能体在连续任务上的累积效用最大化 [9] 演化内容(What to Evolve) - 模型演化包括决策策略优化(如通过自我生成挑战性任务SCA或自然语言反馈在线微调SELF、TextGrad)和经验积累学习(如Reflexion自我反思机制、RAGEN强化学习框架) [13] - 上下文演化涵盖记忆动态管理(如Mem0框架的ADD/MERGE/DELETE机制、Expel提炼可泛化规则)和指令提示自动化优化(如APE候选提示生成、DSPy可微分程序联合优化、MASS多智能体通信优化) [13] - 工具演化分为自主创造新工具(如Voyager探索式学习、Alita响应式代码生成)、已有工具精通(如LearnAct自我纠错循环)以及管理与选择(如ToolGen工具调用生成问题、AgentSquare元学习优化组件配置) [13] - 架构演化针对单智能体(如TextGrad优化工作流节点、Darwin Gödel Machine重写自身源代码)和多智能体系统(如AFlow蒙特卡洛树搜索协作流程优化、ReMA多智能体强化学习协同策略) [14] 演化时机(When to Evolve) - 测试时自进化发生在任务执行期间,例如AdaPlanner通过ICL动态修正计划、利用"self-edits"指令触发即时SFT更新模型权重、LADDER框架通过RL实现即时技能获取 [20] - 测试间自进化发生在任务执行之后,例如STaR和SiriuS通过SFT从成功或失败推理链生成训练数据实现自举式提升、RAGEN和WebRL利用RL在任务间歇期优化策略 [20] 演化方法(How to Evolve) - 基于奖励的演化利用文本反馈(如Reflexion提供自然语言改进建议)、内部奖励(如CISC利用模型置信度自我评估)、外部奖励(如工具执行成功/失败)和隐式奖励(如从模型logits提取内生奖励函数) [21] - 模仿与演示学习通过自我生成演示(如STaR)、跨智能体演示(如共享经验库学习)或混合方式学习高质量范例 [21] - 基于种群的演化方法维护多个智能体变体或团队,通过选择、变异和竞争机制探索解空间,例如Darwin Gödel Machine的开放式代码进化、EvoMAC的文本反向传播机制 [22] 应用场域(Where to Evolve) - 通用领域演化通过记忆机制(如总结历史经验形成可复用知识)、模型-智能体协同进化(如奖励模型与世界模型相互促进)和课程驱动训练(如WebRL自适应生成难度任务)拓展广泛任务能力 [25] - 特定领域演化在垂直领域深耕,例如编码领域SICA自主修改代码库、GUI领域通过真实交互学习界面操控、金融领域QuantAgent优化量化策略、医疗领域Agent Hospital提升诊断能力、教育领域PACE个性化调整教学策略 [25] 评估范式 - 提出五大评估目标:适应性(Adaptivity)、知识保留(Retention)、泛化性(Generalization)、效率(Efficiency)和安全性(Safety) [28] - 评估模式分为静态评估、短时程自适应评估和长时程终身学习评估 [28] - 适应性通过迭代步骤成功率(如65、29、247项研究)和适应速度(如Voyager)衡量;知识保留通过遗忘率(FGT)和反向迁移(BWT)衡量;效率通过Token消耗、时间支出和工具生产率衡量;安全性通过安全评分、危害评分和泄漏率等衡量 [29] - 代表性基准测试包括ScienceAgentBench(102项科学数据分析任务)、SWE-bench(2,294项软件工程任务)、OSWorld(GUI任务)、LifelongAgentBench(1,396项长时程任务)和AgentBench(1,360项通用任务) [31]