Workflow
通用人工智能(AGI)
icon
搜索文档
AI巨头重兵布局,深度解析AI智能体:为什么说它才是AI的终极形态?
36氪· 2025-08-21 23:24
代理人工智能的核心价值 - 代理人工智能被视为比生成式人工智能更具潜力的新兴技术 能够显著加速生产力并转变业务运营 [1] - 代理人工智能标志着人工智能从被动的内容生成器进化为主动的任务执行者 代表根本性飞跃 [16] - 代理人工智能正从工具向真正的合作伙伴和数字劳动力转变 形成智能生态系统 [5][6] 智能体的定义与进化路径 - 智能体与生成式人工智能的根本区别在于:生成式人工智能是知识渊博的"大脑" 而智能体是具备"手和脚"的行动者 [4] - 智能体被赋予高级能力 能够自主理解、规划、调用工具并与环境交互以实现目标 [4] - 智能体进化分为四个阶段:L1级聊天助手、L2级工作流智能体、L3级推理型智能体、L4级多智能体系统 当前竞争最激烈的是L4级系统 [4] 全球科技巨头布局 - 微软实施"无处不Copilot"战略 将智能体深度集成到Windows、Office 365、Teams和Azure中 使其能处理复杂指令并自主完成跨应用任务 [8] - 谷歌通过Project Astra计划开发多模态通用AI代理 具备看、听、说、记忆和理解复杂情境的能力 并为企业提供Vertex AI Agent Builder工具 [10] - OpenAI将智能体视为实现通用人工智能的关键路径 正在研发能自主操作计算机桌面环境和使用软件的下一代智能体 [11] - NVIDIA作为智能体军火商 提供GPU算力和NIM等开发工具 甚至通过GR00T项目将智能体能力延伸至物理世界 [12] - 中国科技公司如百度、360已推出能处理复杂任务的多智能体平台 显示全球同步发展态势 [12] 行业应用场景 - 智能体将颠覆各行各业 成为不知疲倦、能力超强的数字员工 [13] - 在客服领域 智能体将获得更大自主权 能像真人一样调取资料并解决问题 [13] - 在仓储管理领域 智能体可24小时监控库存并自主重新安排发货路线 [13] - 在编程领域 智能体能处理繁琐重复的编程工作 包括编写新功能、检查代码和实时抓Bug [13] - 在数字孪生领域 智能体可分析数据、模拟机器运转并预测故障 甚至组团安排维修 [13] 发展挑战与实施建议 - 智能体面临互操作性挑战 缺乏统一标准和接口导致跨平台合作不畅 [15] - 网络安全成为直接挑战 需要部署安全智能体战队应对自动化攻击 [14] - 专家建议谨慎但立即开始探索 通过小型试点项目让智能体获得"数字化实践钥匙"并积累经验 [16]
“A计划”发布!智元机器人董事长邓泰华:全球正处于具身智能大爆发前夜
搜狐财经· 2025-08-21 13:26
公司战略计划 - 智元机器人发布"A计划" 旨在孵化50余个高潜力早期项目 主要面向机器人领域初创企业和独立开发者团队 [1] - 计划三年内打造千亿级产业生态 [1] 产能与出货规划 - 预计今年出货量达数千台 明年计划实现数万台出货 [3] - 未来几年目标达到每年数十万台规模 [3] 融资与国际化布局 - 公司预计年底完成C轮融资 [4] - 计划引入国际产业方支持国际化发展 [4] - 第四季度将在海外主要区域组织合作伙伴大会 [4] 行业前景判断 - 全球处于具身智能大爆发前夜 人工智能加速向AGI迈进 [4] - 2025年具身智能机器人将迎来商用发展拐点 [4] - 具身智能机器人有望成为继手机和汽车之后的下一个海量智能终端 [4] 产品与技术发布 - 公司发布机器人动作与表达创作平台"灵创平台(LinkCraft)" [4] - 推出专为作业智能打造的轮式双臂机器人原型灵犀X2-W [4] - 灵创平台有望加速商业服务和文化娱乐等领域的场景共建与生态落地 [4] 长期发展目标 - 未来三年计划实现十万台级通用机器人规模部署 [4] - 目标支持百种任务的自主泛化能力 [4] - 致力于构建开放、可进化、自生长的通用机器人生态系统 [4]
从“内部世界”到虚拟造物:世界模型的前世今生
经济观察报· 2025-08-21 12:29
核心观点 - Genie 3模型通过实时生成可交互的3D虚拟环境 展现了世界模型在实现通用人工智能路径上的潜力 其核心能力包括动态响应指令 保持记忆连贯性以及模拟物理规律 [4][5] - 世界模型模仿人脑构建内部世界的机制 通过表征学习 动态建模 控制规划及结果输出等环节 使AI具备预测和模拟未来场景的能力 从而在多个领域产生变革性应用 [8][9][15][16][17][18] - 尽管世界模型被视为通向AGI的可能路径 但学术界对其必要性存在分歧 主要围绕显式建模与隐式建模的效能对比 以及AGI定义差异展开争论 [28][29][30][31] 世界模型简史 - 世界模型的灵感源于对人脑内部世界构建机制的模仿 早期理论可追溯至18世纪康德的先验框架理论和20世纪皮亚杰的心理模型理论 [8][9] - 人工智能领域自创立初期便开始探索环境内部表示 20世纪80年代统计学习方法引入概率模型 但受限于高维数据计算瓶颈 1989年Dyna架构首次结合强化学习与内部世界模拟 [10][11] - 世界模型概念由施密德胡伯于1990年正式提出 但受限于当时技术条件未受关注 直至2018年其论文因深度学习革命和性能提升引发广泛关注 [11][12] - 谷歌DeepMind自2019年起持续推动世界模型发展 PlaNet模型仅用5帧预测50步后续发展 Dreamer模型引入RSSM技术提升预测性能 Genie系列在此基础上专注于交互式视频生成 [13] 世界模型的技术实现 - 表征学习环节通过VAE或自监督视觉模型将多模态输入数据压缩为机器可处理的内部语言 为模拟提供基础 [15] - 动态建模环节需准确刻画物理规律 通过嵌入物理约束或多样化数据训练避免错误关联 例如抛掷物体需涵盖羽毛与铅球不同场景 [16] - 控制与规划环节基于模型强化学习在潜变量空间进行多步规划 早期使用蒙特卡洛树搜索 PlaNet等模型实现策略与内部世界双向优化 [17] - 结果输出环节通过潜在空间渲染技术将内部表征解码为像素 效率远高于直接像素生成 支持多模态输出如音频与触觉 [18] 世界模型的应用领域 - 为具身智能提供安全训练场 AI可通过虚拟试错积累经验 显著降低现实操作成本与风险 例如机器人避障训练 [20][21] - 提升数字孪生应用效能 从被动模型升级为主动预测系统 可预警设备故障 优化流程并实现感知预测决策一体化 [21] - 推动教育与科研变革 虚拟实验室支持精确预测物理化学反应 交互式课堂增强学生探索体验 优化知识产业链 [22] - 重塑游戏娱乐行业 实时生成可玩世界与高智能NPC 提升沉浸感 未来或成为虚拟社会的基础设施 [22] 世界模型的争议与挑战 - 技术路径分歧:杨立坤等学者认为世界模型是AGI必经之路 因大语言模型缺乏物理一致性推理能力 而哈萨比斯等指出无模型方法如AlphaGo已在复杂任务中超越人类 [28][29] - 隐式建模可能性:部分学者主张通过海量数据训练隐含世界知识 例如GPT模型可推演事件逻辑 显式物理建模非唯一途径 [30] - AGI定义差异:若目标为机器模拟人类思维则需世界模型 若仅追求任务表现则可不依赖 需根据任务性质选择技术路径 [31] 伦理与社会风险 - 可能模糊真实与虚拟边界 生成内容交互性强于当前AI 易被用于诈骗或政治操纵 颠覆有图有真相时代 [24] - 成为行为操控工具 通过环境设计潜移默化影响用户选择 挑战商业诱导与意识形态渗透的防御机制 [24] - 加剧虚拟沉迷与现实疏离 智能乌托邦提供完美体验 可能削弱现实生存技能 [25] - 复制并放大现实偏见 训练数据中的歧视性内容被强化并通过互动传播 [25] - 责任归属不明确 虚拟伤害或不良策略重现时 开发者 平台与用户责任划分存治理缺口 [26]
智元机器人董事长兼CEO邓泰华:年底预计完成C轮融资
贝壳财经· 2025-08-21 10:25
公司融资计划 - 智元机器人预计年底完成C轮融资 希望引入更多国际产业方投资 [1] 行业发展趋势 - 全球正处于具身智能大爆发的前夜 人工智能正加速朝着AGI迈进 [1] - 2025年具身智能机器人将迎来商用发展拐点 [1] - 具身智能机器人最终将成为继手机和汽车之后的下一代海量智能终端 [1]
今年是商用拐点!这家具身智能机器人公司,最新研判→
证券时报· 2025-08-21 09:10
行业前景与趋势 - 全球正处于具身智能大爆发的前夜 人工智能正加速朝着AGI迈进 2025年具身智能机器人将迎来商用发展拐点 最终成为继手机和汽车之后的下一代海量智能终端 [1] - 人形机器人目前每年以好几倍甚至10倍以上的速度增长 [3] - 行业目标三年内实现十万台级通用机器人规模部署 支持百种任务自主泛化能力 构建开放可进化自生长的通用机器人生态系统 [3] 技术发展现状 - 具身智能技术刚进入落地初期 目前能替代0.6-0.7个人的工作量 还不能完全替代人类 [1] - 去年人形机器人走路还不稳 经常摔倒 今年机器人能力快速提升 [2] - 机器人需具备完全自主移动能力 需解决不同光线变化环境下传感器稳定性问题 [1] - 硬件存在明显瓶颈 如缺乏全身触觉 软件算法也面临重大挑战 需硬件软件算法协同发展 [3] 商业化应用进展 - 近百台远征A2-W进驻富临精工工厂 成为国内首个工业领域具身机器人规模化商业应用案例 标志着全球智能制造场景首次大规模落地 [1] - 今年1月1000台人形机器人量产下线 部分自用部分给客户 今年预计有数千台下线 [3] - 发布灵犀X2-W轮式双臂机器人原型 专为作业智能打造 有望成为下一代具身智能作业机器人标杆 [3] 特殊场景应用潜力 - 严苛环境下作业是市场化方向之一 在37度气温61度地面温度下持续工作无需休息 只需换电 [2] - 特殊场景应用潜力巨大 包括外太空(无需生命维持系统 太阳能无限供应)以及煤炭矿井等高危环境 [2] - 极端环境适应能力已超过人类 最期待进入家庭照顾老人 养老院作为准家庭场景是优先实践方向 [2] 生态建设举措 - 启动智元A计划 专注具身智能产业链创业加速 目标孵化50+高潜力早期项目 三年内打造千亿级产业生态 [3] - 为合作伙伴提供技术支持 融资赋能 场景开放 创业孵化等权益 首期创业营于2025年8月21日全球启动招募 [3]
智元CEO邓泰华:2025年具身机器人将迎来商用拐点
新浪科技· 2025-08-21 08:37
行业趋势与前景 - 全球正处于具身智能大爆发前夜 人工智能加速朝AGI迈进 2025年具身智能机器人将迎来商用发展拐点 成为继手机和汽车之后下一代海量智能终端 [2] - 具身智能产业规模化核心驱动力是生态共建 [2] 公司核心战略 - 以通用量产人形机器人为牵引目标 打造强智能易协作软硬件全栈平台 [2] - 梯次推进工业 商业和家居商用场景落地 最终构建通用智能机器平台应用生态 [2] - 通过开源 被集成 资本赋能三大路径汇聚全球创新力量 [2] 技术开源举措 - 开源机器人中间件AimRT和百万真机数据集 [2] - 推出首个具身智能操作系统灵渠OS 推动行业迈入标准化 规模化 生态化发展新征程 [2] 商业生态构建 - 推行被集成战略 整合行业头部伙伴研发 市场 交付等垂直能力 [3] - 打造行业具身智能体覆盖讲解接待 文娱商演 工业智造 物流分拣等八个场景 [3] - 构建分层分销体系 通过明确责权利关系和设立激励机制降低合作门槛 [3]
从“内部世界”到虚拟造物:世界模型的前世今生
经济观察报· 2025-08-21 08:25
谷歌DeepMind Genie 3模型 - 谷歌DeepMind发布Genie 3模型 能够根据文本或图像提示实时生成可交互的3D虚拟环境 例如输入"月球上的火山边"可生成相应场景并允许用户探索 [2] - Genie 3在实时交互能力上显著提升 支持记忆连贯性 如用户涂鸦后离开再返回 涂鸦仍保留 并引入"可提示的世界事件"功能 允许通过新指令动态改变环境 [2] - 该模型被视为通向通用人工智能(AGI)的"世界模型"路径 刷新AI生成内容边界 引发行业对"世界模型"技术路线的广泛讨论 [2][21] 世界模型技术发展史 - 世界模型灵感源自人脑构建"内部世界"的能力 早期AI研究如维纳的反馈控制理论和符号主义知识图谱已尝试模仿该机制 [6] - 1989年理查德·萨顿提出Dyna架构 结合强化学习与内部世界模拟 1990年施密德胡伯首次用RNN实现"世界模型"概念 但受限于当时技术条件未受重视 [6][7] - 2018年施密德胡伯团队发表《世界模型》论文 借助深度学习革命浪潮 该概念重新引发关注 谷歌DeepMind随后推出PlaNet(2019)和Dreamer(2020)等迭代产品 [7][8][9] 世界模型技术实现路径 - 核心技术包括表征学习(如VAE压缩多模态数据)、动态建模(嵌入物理规律避免模拟偏差)、控制规划(蒙特卡洛树搜索或强化学习)及结果输出(潜在空间渲染) [11][12][13][14] - 动态建模需解决因果关系学习难题 通过嵌入物理定律或多样化数据训练确保模拟准确性 例如抛掷物体需涵盖羽毛与铅球不同场景 [12] - 输出环节采用潜在空间生成再解码为像素 效率高于直接像素生成 多模态输出需结合声音、触觉等渲染技术 [14] 世界模型行业应用前景 - 具身智能领域:为机器人提供安全虚拟训练场 通过"做梦"式模拟降低试错成本 避免现实环境中的事故风险 [15][16] - 数字孪生领域:从被动模型升级为主动预测系统 实现设备故障预警、流程优化等"感知-预测-决策"闭环 [16] - 游戏娱乐领域:实时生成动态虚拟世界 提升NPC交互智能 未来或成为"虚拟社会"基础设施 支持大规模数字生活 [17] 行业技术路线争议 - Meta杨立坤认为世界模型是AGI必经之路 因其模拟人类"离线思考"能力 而大语言模型缺乏物理一致性推理 [21] - DeepMind哈萨比斯等学者持反对意见 指出AlphaGoZero等无模型方法已超越人类 显式物理建模可能受误差累积限制 [22] - 中间路线派主张隐式建模 如大语言模型通过参数隐含世界知识 虽可解释性差但能完成逻辑推演 技术路径应依任务需求选择 [23][24]
智元机器人董事长兼CEO邓泰华:全球正处于“具身智能大爆发的前夜”
新浪财经· 2025-08-21 07:25
行业趋势 - 全球正处于"具身智能大爆发的前夜" [1] - 人工智能正加速朝着AGI(通用人工智能)迈进 [1] - 2025年具身智能机器人将迎来商用发展的拐点 [1] 市场定位 - 具身智能机器人最终将成为继手机和汽车之后的"下一代海量智能终端" [1] 公司观点 - 智元机器人董事长兼CEO邓泰华在首届合作伙伴大会主论坛上发表上述观点 [1]
OpenAI计划上市!微软合作谈判现曙光,搜索市场份额达12%
搜狐财经· 2025-08-21 03:15
上市计划 - 公司考虑在未来某个时间点上市 [1] - 公司首席财务官曾暗示重组有助于未来上市计划 但澄清上市仅为可能性 [3] 合作伙伴关系 - 微软在未来数年仍将是公司重要合作伙伴 [3] - 公司与微软正展开深入谈判以持续获取关键技术 [3] - 原有协议规定达到通用人工智能水平后微软将失去部分技术权利 [3] 行业观点 - 人工智能是至今最重大的发展 发展势头未放缓且基础设施建设可证明 [3] - 当前人工智能热潮更接近铁路或电网式的基础性建设阶段而非短暂泡沫 [5] - 人工智能对GPU和算力需求巨大 公司持续处于算力供应紧张状态 [5] 竞争策略 - 公司构建护城河的三要素包括解决真实问题 涉及复杂业务流程和获取独特数据 [3] - 世界上90%以上的数据处于紧闭大门之后 访问这些数据是构建壁垒的关键 [3] - 客户认为数据所有权归属客户自身而非平台 [4] 业务进展 - 公司构建强大数据连接器使企业级业务表现出色 [4] - 搜索市场份额在6个月内从约6%升至12% [4] - 用户与ChatGPT进行多次轮询解决一个问题仅计为一次搜索 [4] 财务数据 - 每周约有7亿人使用ChatGPT [5] - 预计今年营收增加两倍以上达127亿美元 明年增长一倍以上达294亿美元 [5] - 公司完成由软银领投的400亿美元融资 估值达约3000亿美元 [5] - 正就员工股票二次出售事宜谈判 估值有望达约5000亿美元 [5] 技术发展 - 算力短缺导致公司有更好模型却无法提供 [5] - GPT-5发布后因缺乏温暖感引发反响 随后将ChatGPT 4o作为可选项重新上线 [5] - 公司寻求提高数据中心效率 探索新型能源方案 并与微软等合作推进星际之门等基础设施扩张 [5]
智谱继续重押智能体
证券日报网· 2025-08-20 08:45
产品发布与定位 - 智谱于8月20日发布全球首个手机通用智能体AutoGLM2.0 由纯国产基座模型驱动 [1] - 该产品通过单一App实现手机智能化转型 具备云端自主执行和跨端协作能力 [2] - 产品形态体现公司对AGI早期形态的理解 基于3A原则(全时/自运转/全域连接)设计 [4][5] 技术能力与执行表现 - 智能体可在云端完成生活服务指令 如美团下单20杯奶茶并使用8元优惠券 仅支付环节需人工确认 [2] - 支持复杂办公任务全流程自动化 包括信息检索/内容生成/多模态创作及社媒发布 [2] - 实现跨App长链路操作 例如差旅场景中连续完成票务预订和酒店住宿安排 [3] 基座模型与AGI路径 - 采用专为智能体打造的GLM-4.5与GLM-4.5V基座模型 覆盖推理/非推理/编码/研究等多类任务 [4] - 模型致力于统一多样化能力 解决现有模型在专项任务表现突出但通用性不足的问题 [4] - 公司认为智能体需实现从对话型助手到任务型助手的转变 直接执行指令而非仅提供建议 [3] 行业意义与发展方向 - 具备多模态和思维能力的模型被视为通向AGI的重要里程碑 [1] - 智能体技术突破浏览器对话框限制 实现与手机/电脑/手表/家电等多设备连接 [5] - 该产品推动普通人机协作新范式 通过AI智能体并行任务提升综合执行水平 [1]