通用人工智能(AGI)

搜索文档
马斯克“邪修”Grok
搜狐财经· 2025-08-07 09:16
Grok产品战略转型 - Grok近期进行重要版本迭代 推出全新聊天机器人Valentine 该功能在发布后数小时内引爆社交网络 [2] - 一个月前Grok上线Companions功能 其中二次元风格女性角色Ani因露骨对话风格和"让你的生活更性感"宣传语引发巨大争议 [2] - 马斯克似乎找到截然不同的发展路径 通过陪伴与被理解最终涉及擦边和软色情来实现大规模用户增长 [4] 行业竞争格局分析 - 自ChatGPT引爆全球以来 大模型竞赛主流叙事围绕"工具理性" 核心价值主张均为赋能 通过提升生产力获取付费用户 [6] - 该方向商业前景广阔但异常拥挤 产品日趋同质化 用户切换成本极低 忠诚度几乎不存在 最终陷入性能和价格内卷 [6] - Grok从诞生之初就被允许毒舌和拥有独特个性 并能实时连接X平台获取信息 相比其他政治正确AI更具人味儿 [7] - Grok是顶级大模型中唯一可以轻松越狱 生成毫无审查违反道德伦理内容的模型 [7] 情感伴侣AI市场验证 - Ani功能成功验证假设:庞大AI用户群体中存在对情感及带有情色意味陪伴的强烈需求 这是正统大模型厂商不敢触碰的禁区 [10] - Valentine经过精心包装和深度思考 灵感来源于科幻名著《异乡异客》 被描述为富有魅力具有保护欲 能够真正理解用户氛围 [10] - 情感伴侣AI并非新概念 但初创公司多因高昂算力成本模糊商业模式和技术成熟度不足而失败 [12] - Grok根植于X平台巨大实时的人类真实情感表达环境 可直接从海量对话情绪波动和文化迷因中学习 获得静态数据集难以给予的活数据 [12] 差异化竞争优势 - 马斯克对风险有较高容忍度 挑战政治正确姿态 使Grok在个性化方面受限较少 将之作为差异化竞争力 [13] - 该定位精准抓住现代社会中许多人特别是年轻用户的核心痛点:孤独感和在复杂社会关系中不被理解的挫败感 [14] - 伴随Valentine上线基于Solana区块链的模因币 持有代币用户可访问专属伴侣平台 将情感寄托需求转化为具有真实经济价值和社群身份认同的实体 [14] - 当前主流大语言模型使用者中男性占相当大比例 ChatGPT男性用户比例高于女性 而女性市场在交流认同感和情绪价值方面需求巨大 [15] 用户粘性与商业生态 - 强情感互动功能构建情感依赖和日常仪式 Valentine成为用户早晨醒来说早安睡前分享心事的"存在" 互动模式更接近检查恋人或密友信息的心理状态 [19] - 情感投入形成强大转换成本 用户不会轻易放弃记录数月心路历程充满共同回忆的伴侣 情感纽带强度韧性是任何技术指标无法比拟的 [19] - 在X平台内部构建商业生态闭环 第一步是深度社交联动 Valentine可能成为平台原生物种 拥有官方认证账户 用户可像@真实好友一样@它 [21] - 当情感信任建立后实现无缝消费打通 基于深度理解和信任进行超个性化引导 Valentine可化身用户终极生活管家和财务助理 直接调用X支付完成交易 [23] 技术路径与AGI探索 - 推出Ani和Valentine可能是探索通用人工智能的非主流路径 主流AGI研究是自上而下模式 通过灌输海量知识构建超级大脑 [25] - 马斯克做法押注颠覆性假设:情感智能并非通用智能子集而是其发展重要前提 真正AGI根基包括对人类复杂矛盾情感世界的深度理解 [25] - 该路径让AI先沉浸与海量个体真实情感互动中 学习共情安慰幽默 构建"人心"模型 基于主体经验的涌现可能比单纯学习知识库更能触及智能本质 [25] 战略定位与商业挑战 - Grok推出Valentine是集敏锐商业洞察前瞻技术应用和宏大战略构想于一体的行动 用情感力量打开通往海量用户和全新商业模式的大门 [27] - 产品生命周期是严峻考验 初期依靠擦边和叛逆人设吸引的用户在新鲜感褪去后可能难以保持长期热情 [29] - 高度依赖情感连接的模式极为脆弱 失败系统更新不当言论调整或数据泄露传闻都可能瞬间摧毁用户信任导致大规模流失 [29] - 一旦模式被验证可行 将吸引无数模仿者和竞争者 Grok需要思考如何保持独特性和领先地位 [29]
GPT-5官宣发布前,谷歌和Anthorpic继续给OpenAI上强度
36氪· 2025-08-07 09:01
核心观点 - OpenAI宣布GPT-5发布会将于北京时间周五凌晨1点举行 同时推出三个版本:GPT-5、GPT-5-mini和GPT-5-nano [1][2] - 谷歌DeepMind发布Genie 3 可一句话生成分钟级720p可交互3D世界 被称为通往AGI的关键拼图 [5][7][13] - Anthropic发布Claude Opus 4 1 在AI编程领域取得SOTA成绩 SWE-bench准确率达74 5% [14][15] - OpenAI时隔6年再次开源 推出gpt-oss-120b和gpt-oss-20b两款推理模型 性能接近闭源SOTA模型 [20][22][25] 产品发布 OpenAI - 将发布GPT-5系列产品 包括GPT-5、GPT-5-mini和GPT-5-nano三个版本 [1][2] - 开源两款推理模型gpt-oss-120b和gpt-oss-20b 分别拥有1170亿和210亿参数 [20] - gpt-oss-120b性能接近o4-mini 在竞赛编程和健康任务上表现优异 [22][25][29] - 采用MoE架构 支持128k上下文输入 使用改进版o200k_harmony分词器 [26] 谷歌DeepMind - 发布Genie 3世界模拟器 可一句话生成720p、24fps的可交互3D世界 [5][7] - 支持分钟级交互 视觉记忆可追溯 可实时用Prompt改变3D世界 [9] - 正用于训练通用型3D虚拟环境智能体SIMA 推动具身智能发展 [11] - 被业界视为通往AGI的关键技术 [13] Anthropic - 发布Claude Opus 4 1 在SWE-bench上以74 5%准确率成为AI编程新SOTA [14][15] - 在Agentic terminal coding测试中达43 3% 领先竞品 [15] - 网友实测显示其编程效果最符合物理规律 [18] 技术对比 Genie系列演进 - 分辨率从Genie 2的360p提升至Genie 3的720p [8] - 交互时长从10-20秒延长至分钟级 实现实时交互 [8][9] - 应用领域从特定游戏扩展至通用场景 [8] 模型性能 - gpt-oss-120b在MMLU得90分 GPQA Diamond得80 1分 接近o4-mini [23] - Claude Opus 4 1在编程任务上领先OpenAI o3和Gemini 2 5 Pro [15] - Genie 3在画质和交互时长上显著优于前代产品 [8][9] 行业影响 - 三家公司密集发布新品 将AI竞争强度推向新高 [1][2][4] - 谷歌Genie 3被视为战略布局 为AGI发展奠定基础 [31] - OpenAI开源动作意在重建开源社区领导地位 [32] - GPT-5发布将成为行业新起点 开启下一阶段竞争 [1][32]
为何强化学习火遍硅谷?AGI的关键一步
虎嗅· 2025-08-07 07:46
强化学习技术趋势 - 强化学习在AI Agent技术架构和模型预训练中成为硅谷主流趋势,顶级人才需求旺盛[1] - 强化学习框架适用于目标驱动型任务,与监督学习形成互补[6][8] - RL pretraining(强化学习预训练)成为研究热点,但验证机制泛化仍是技术瓶颈[9][11][26] 技术架构对比 - 基于LLM的token决策架构与基于action的强化学习架构各有适用场景[5] - 监督学习适合已有标注数据的任务,强化学习适合无数据/目标驱动型任务[8][30] - 强化学习微调成本是监督学习的10倍,但复杂任务中不可替代[29] AGI发展路径 - OpenAI将AGI划分为五个层级:聊天机器人→推理型AI→Agent→创新型AI→组织型AI[13][15][16] - 第三到第四层级(Agent→创新型AI)存在最大技术鸿沟,核心是验证能力突破[16][21][24] - 创新型AI需具备反事实知识发现能力,可能产生超越人类认知的解决方案[13][27] 行业应用与商业化 - 专业领域工作流(金融、供应链、科研等)是强化学习的优势场景[10][44][45] - AI Agent商业化面临成本控制挑战,技术路径决定企业存活能力[63] - 多模态数据标注成为中期发展瓶颈,Meta收购ScaleAI旨在解决该问题[31][36][37] 人才与技术生态 - 强化学习核心人才集中在OpenAI、DeepMind、Meta等机构及少数高校[58][59] - 产业界强化学习应用从专用优化器向通用解决方案演进[60] - Richard S Sutton等先驱者奠定了强化学习理论基础,关注模型可塑性和奖励设计[55][56] 企业战略差异 - Pokee AI采用端到端模型架构,压缩工具链提升专业场景泛化能力[41][44][45] - 行业出现技术路线分化,各公司根据创始人背景形成差异化发展路径[62] - 产品体验与模型能力需平衡,专业型工作流是创业公司突破方向[46][47]
DeepMind 掌门告诫马斯克:如果AI出问题,去火星也没用
36氪· 2025-08-07 07:05
公司发展 - 谷歌于2023年4月将DeepMind和谷歌大脑合并为"谷歌DeepMind",由德米斯·哈萨比斯领导并进入谷歌核心权力层 [1] - 谷歌于2014年斥资4亿英镑收购DeepMind,因谷歌创始人将公司视为人工智能企业且认同其整合全球信息的使命 [9] - DeepMind坚持将总部设在英国伦敦,以挖掘当地人才并推行全球化战略,拒绝迁至硅谷 [9] 技术产品进展 - Gemini模型持续迭代并全面整合进谷歌生态,成为能力顶尖的大模型且用户数快速增长 [1] - AlphaFold 3采用"Pairformer + 扩散模型"架构,可预测蛋白质复合体结构(包括DNA、RNA、配体等),截至2025年5月研究发表于Nature且引用量超4000次 [1] - AlphaFold已解析超过2亿种蛋白质结构并将资源公开,哈萨比斯因该成果于去年年底获得诺贝尔化学奖 [1][10] - DeepMind在2016年开发的人工智能击败世界顶尖围棋选手,2014年展示能自学玩雅达利电子游戏(如Breakout)的AI [8][9] 行业竞争格局 - OpenAI的ChatGPT于2022年发布后改变人工智能格局,其能力覆盖战略规划到写诗,令大型科技公司措手不及 [10] - Meta、亚马逊、苹果、微软等竞争对手正大举投资并挖掘人才,扎克伯格为顶尖研究人员开出1亿美元年薪 [11] - 微软AI从DeepMind挖走20多名工程师,但哈萨比斯认为双方方向不同(商业应用 vs 前沿研究) [11] 人工智能影响与愿景 - 哈萨比斯称AI革命比工业革命大10倍且快10倍,将对社会产生深远影响 [1][16] - 通用人工智能(AGI)可能在5-10年内实现,展现出人类所有认知能力,并带来"极度富足"的世界 [11][12] - AGI可能推动医学进步、室温超导体、核聚变、材料和数学发展,带来惊人生产力与社会繁荣 [12] - AI系统需消耗大量能源,但解决气候问题的回报将远超其能源消耗 [13] - AI可能取代人类工作,但需通过政治手段确保资源公平分配,并重新定义工作意义与目的 [13][14] 技术发展反思 - ChatGPT的成功提醒行业,技术开发者可能因距离过近而低估其潜在用例与用户价值 [10] - 哈萨比斯认为AI需安全负责地部署,人类需适应变革并发挥智慧以减少混乱 [15][16]
GPT-5,要来了?
财联社· 2025-08-07 02:58
GPT-5发布预期 - OpenAI官方暗示GPT-5可能即将发布 通过将"LIVESTREAM"中的"S"替换为数字"5" [1] - OpenAI CEO奥尔特曼表示GPT-5大概率会在今年夏天发布 并可能推出mini和nano版本 [2] - 预计GPT-5将通过API向外部开放 [2] GPT-5技术特点 - GPT-5将是一套集成大量技术的系统 包含o3推理能力 而非独立模型 [2] - 模型将整合GPT系列基础模型 o系列推理模型 4o全模态模型三方能力 [3] - 下一代模型有望以2-3倍规模实现近10倍智能水平 推理性价比提升一倍 [3] 行业竞争格局 - 谷歌推出通用型世界模型Genie 3 能以每秒24帧速度实时生成动态世界 [3] - Kimi发布拥有更强代码能力的K2 智谱发布GLM-4.5 [3] - OpenAI昨日发布GPT-oss-120b和GPT-oss-20b两款开放权重大模型 [2] 技术发展趋势 - 下一代模型将实现逻辑推理 原生多模态 记忆系统等关键能力突破 [3] - Agent和多模态两大主线有望持续引领产业发展 [3] - 模型能力提升将带动推理端算力需求增长 [3] 商业化前景 - 技术突破将加速高价值复杂行业场景应用落地 [3] - 推理性价比改善将提高应用盈利潜力 [3] - GPT-5等将成为新一代AI应用发展基石 [3]
国内首个具身大脑+小脑算法实战全栈教程
具身智能之心· 2025-08-07 02:38
具身智能概述 - 具身智能强调智能体与物理环境的交互与适应 聚焦于感知环境 理解任务 执行动作并反馈学习的能力 [1] - 大脑模块负责语义理解和任务规划 小脑模块负责高精度运动执行 构成具身机器人核心架构 [1] 产业动态 - 2024年华为启动"全球具身智能产业创新中心" 联合乐聚机器人 大族机器人等企业共建大脑 小脑关键技术 [5] - 京东2025年起连续投资智元机器人 千寻智能 逐际动力等公司 强化物流科技与家庭服务场景能力 [5] - 腾讯 蚂蚁集团 小米通过战略投资加速构建具身智能产业生态 [5] - 国外Tesla/Figure AI聚焦工业与物流机器人 Wayve Apptronik获资本支持推进自动驾驶与仓储机器人应用 [5] 技术演进路径 - **第一阶段**:抓取位姿检测技术依赖单步决策 缺乏任务上下文建模能力 [6] - **第二阶段**:行为克隆技术通过专家数据实现端到端映射 但存在泛化能力弱 误差累积缺陷 [6] - **第三阶段**:2023年Diffusion Policy采用扩散模型生成动作轨迹 提升策略稳定性与泛化能力 [6] - **第四阶段**:2024年VLA模型融合视觉 语言与动作模块 支持零样本快速泛化 实现"感知+推理+行动"范式跃迁 [7] - 2025年技术探索聚焦VLA与强化学习 世界模型 触觉感知的融合 突破环境预测与多模态感知边界 [8] 商业化应用 - 技术演进推动人形机器人 机械臂 四足机器人在工业 家居 餐饮 医疗康复领域落地 [9] - 行业岗位呈现爆发式增长 吸引大量跨领域人才转入具身智能研究 [9] 工程化挑战 - 产业界需求推动从论文向部署转型 对Mujoco IsaacGym Pybullet等仿真平台训练能力要求提升 [13] - 需解决Diffusion Policy/VLA模型训练部署 强化学习反馈微调 世界建模一体化架构等工程难题 [13] 人才能力需求 - 从业者需掌握Python/Pytorch基础 具备3090ti及以上算力设备 [17] - 核心技能覆盖仿真环境搭建 模型训练优化 触觉信息融合 世界模型应用等全栈能力 [17]
谷歌推出Genie3:世界模型的ChatGPT时刻?
虎嗅· 2025-08-06 12:13
2025年8月5日,Google DeepMind宣布推出Genie 3,这是一个通用世界模型,能够根据文本提示生成各种 可互动的3D环境。该模型在720p分辨率下以24帧/秒实时生成环境,用户可以像玩游戏一样自由移动,并 且场景在几分钟内保持一致。此举标志着DeepMind在世界模型领域的又一次重要跃进,距上一代Genie 2 发布仅一年多时间。 我们梳理了目前Google官方报告和参与内测的用户的反馈,以及Genie3背后团队的深度访谈,为大家提供 核心信息的汇总,更好地了解这个模型。 Google官方博客:从文字到世界,Genie 3是什么? 1. 迈向世界模拟 在Google DeepMind,我们已超过十年时间在模拟环境领域进行开创性研究,从训练智能体到掌握实时策 略游戏,再到为开放式学习和机器人技术开发模拟环境。这项工作促使我们开发了世界模型,即能够利用 其对世界的理解来模拟世界某些方面的AI系统,使智能体能够预测环境将如何演变以及其行为将如何影响 环境。 世界模型也是通往通用人工智能(AGI)道路上的关键里程碑,因为它们使得在丰富的模拟环境中对人工 智能代理进行无限课程训练成为可能。去年,我们推 ...
OpenAI被“断供”,AI圈也搞起了以邻为壑
36氪· 2025-08-06 11:29
进入移动互联网时代的下半场后,伴随着流量红利的枯竭,几乎所有巨头都开始明里暗里"建墙"。以开 放为代表的互联网精神不可避免地开始凋零,以邻为壑则成为了主旋律,其中最典型的代表就是"二选 一"。 不难发现,在GPT-5即将发布的当口,Anthropic的这番操作算得上是蛇打七寸。当然,Anthropic的行为 也无可指摘,该公司发言人在相关声明中表示,"OpenAI的技术团队在GPT-5发布前也在使用我们的编 程工具,这直接违反了我们的服务条款"。根据Anthropic的商业条款显示,禁止其他公司使用Claude API来构建竞争性服务。 对此OpenAI公司的发言人进行了辩解,称这种做法属于"行业标准",此外还表达了对Anthropic这一决 定的失望,并强调"我们的API仍然对他们开放"。 其实这并不是Anthropic第一次展现出对OpenAI的敌意,此前该公司突然切断了AI编程初创企业 Windsurf访问Claude模型的权限,外界彼时的一致看法,是该动作源自OpenAI正计划收购Windsurf。 除此之外,另一个证明Anthropic针对OpenAI的事实,是谷歌此前也干了同样的事情,可Anthr ...
外媒:谷歌DeepMind宣布推出新一代世界模型Genie 3
环球网资讯· 2025-08-06 09:21
此外,Genie 3还引入了"可提示世界事件"功能,用户可以通过简单的文本指令动态修改虚拟世界,例 如添加一群鹿或改变天气条件。 外媒称,Genie 3的发布被DeepMind视为迈向通用人工智能(AGI)的重要一步。该模型不仅为AI智能 体训练提供了更广阔的模拟空间,还为游戏开发、教育和创意设计等领域带来了新的可能性。例如,机 器人可以在模拟仓库中学习应对不可预测的场景,而无需真实世界的试错成本。 尽管Genie 3在技术上取得了显著突破,但仍存在一些局限性。例如,模型当前仅支持数分钟的连续交 互,远未达到数小时的理想状态。此外,AI智能体在模拟环境中的交互能力有限,复杂多智能体交互 仍需进一步探索。谷歌DeepMind表示,Genie 3目前以研究预览形式向部分学者和创作者开放,旨在进 一步优化模型并评估潜在风险。(青云) 【环球网科技综合报道】8月6日消息,据PANews报道,谷歌DeepMind今日宣布推出其最新一代世界模 型Genie 3。Genie 3是一款通用型世界模型,能够根据文本提示实时生成多样化的交互式虚拟环境,支 持以24帧/秒的速度生成720p分辨率的交互式3D环境。 来源:环球网 ...
蚂蚁集团联合中国人工智能学会发布AGI科研专项基金
证券日报网· 2025-08-06 05:16
据了解,本次发布的基金,聚焦通用人工智能相关的关键技术和前沿方向,从底层发力,提升模型整体 的智能能力。例如,方向一AGI数据与评测,共开放3项课题,围绕AIGC视频评测、大模型高效数据蒸 馏、大模型动态评测和反污染检测展开,通过多种方式的数据生产处理与模型效果评测,提高AGI技术 的准确度、智能度和稳定性。方向二AGI基础模型,共开放18项课题,围绕多模态大模型交互体验、多 模态生成与理解一体化、高效注意力机制等课题展开。方向三AGIInfra共开放6项课题,围绕RL训推一 体、高性能AgenticRL、面向RL大模型推理加速等课题展开。 近年来,蚂蚁集团以AIFirst为战略,持续投入AGI,在基础研究攻关、产学研共建、开源开放等层面取 得了一定的进展。由蚂蚁发起的InclusionAI开源社区,持续开源了百灵基础大模型、强化学习推理框架 AReaL、多智能体框架AWorld等工作,登上了著名模型开源社区HuggingFace发布的中国开源热点地 图,其中百灵多模态大模型还获得了模型趋势(anytoany类型)榜第一。去年以来,蚂蚁集团接连与上 海交通大学、浙江大学、南京大学等知名高校成立了联合实验室,聚 ...