智能体组织
搜索文档
智能体是新宠,但非万能药——专访麦肯锡全球资深董事合伙人周宁人
麦肯锡· 2025-12-24 08:07
AI技术在全球及中国企业的应用现状 - 全球88%的企业已在至少一个业务职能中使用AI技术,比2024年高出10个百分点,但仅三分之一已着手推进AI的规模化落地 [7] - 中国内地AI应用普及率与全球持平,83%的企业在至少一个职能中常态化使用生成式AI,领先全球平均水平 [8] - 中国内地有45%的受访企业实现AI的规模化或全面部署,高于全球38%的均值 [9] AI Agent(智能体)的应用与挑战 - AI Agent热度高,62%的受访组织已在试验,但真正跑通业务流程的企业是少数派,在任何部门中推动AI Agent的公司都不到一成 [10] - AI Agent率先应用于流程清晰、标准化程度高的部门,如IT运维、知识管理、营销与销售 [10] - 部署AI Agent的根源挑战在于需要重构流程、重塑组织并重训员工,多数组织仍处于试用或验证阶段 [11] Agentic AI(智能体AI)成为未来趋势 - Agentic AI被置于技术趋势首位,其核心是AI能主动完成任务 [11] - 推动Agentic AI发展的三大底层动力:推理成本大幅下降(2025年模型推理价格中位数下降约50倍)、小模型爆发、多模态能力突破 [11][12] - Agentic AI深度融入后,将在企业、经济和个人三个层面带来改变,包括重塑组织架构、拉大企业间生产率差距(可能达两位数提升)以及改写工作定义 [12] 金融行业的AI应用与分化 - 金融业是AI技术落地的前沿阵地,但不少金融机构反馈AI应用效果不达预期,投入产出比不高,根源在于应用尚处尝试阶段,未真正重塑作业模式 [3][14] - 高绩效AI组织(能将至少5%的EBIT增长归因于AI)的成功特征在于:绘制明确的AI路线图,并主动重写业务流程,将AI嵌入前线流程与系统 [14] - 大模型加速行业分化,大型金融机构优势明显,但中小金融机构可借助降低的推理成本,通过寻找合适应用场景和合作伙伴实现能力跃升 [15] 实现AI价值的关键经验 - 要通过智能体AI实现业务价值,必须改变工作流程,例如财富管理流程未来在AI助力下可能从五步简化为三步 [16] - 智能体并非万能药,高变化、低标准化的工作流程更适合应用,在部署前需评估任务需求 [16] - 需杜绝“AI垃圾”,重视用户信任,这需要结合专业知识创建评估标准,并让专家持续参与测试 [17] - 人的作用依然不可或缺,需要监督模型准确性、确保合规、运用判断力并处理边缘情况 [17] AI在金融领域的治理与平衡策略 - 不能“一刀切”地应用AI,需根据业务特性选择最适合的AI类型 [17] - 规则型AI适用于信贷审批等标准化场景,可确保决策一致性和可解释性;生成式AI和智能体AI在非标知识领域更具优势,但不应让其直接制定规则 [18] - 需建立完善的治理框架,采取“规则主导+AI辅助”的混合模式,在创新与风险间找到平衡 [18]
AI「智能体组织」时代开启,微软提出异步思考AsyncThink
36氪· 2025-11-05 10:52
核心观点 - 微软团队提出名为“异步思考”(AsyncThink)的新方法,旨在实现LLM从个体智能到“智能体组织”的范式跃迁 [1] - AsyncThink通过“组织者-工作者”协议将内部思考过程组织成可并发执行的结构,以解决现有并行思考方法的高延迟和动态性差等难题 [1][2] - 实验表明,该方法在提高数学推理准确性的同时,将推理延迟降低了28%,并展现出良好的跨任务泛化能力 [1][14][16] 研究方法 - AsyncThink的核心是“组织者-工作者”(Organizer-Worker)思考协议,LLM同时扮演组织者和工作者两个角色 [2] - 组织者负责将复杂问题拆分成子任务,并通过“Fork”和“Join”操作安排任务顺序;工作者负责执行子任务并返回中间结果 [2][4] - 该方法采用两阶段训练过程:冷启动格式微调和强化学习 [4] 训练过程 - 冷启动格式微调阶段使用GPT-4o生成合成训练数据,并对基础LLM进行监督微调,使其掌握AsyncThink框架的组织语法与行动结构 [5] - 强化学习阶段通过改进的群组相对策略优化(GRPO)算法,利用准确性、格式和思考并发奖励来指导模型学习高效、准确的策略 [7][9] 实验评估 - 在多解倒计时任务中,AsyncThink的全对率达到89.0%,显著高于并行思考的68.6%和序列思考的70.5% [11][13] - 在数学推理任务AIME-24和AMC-23上,AsyncThink的准确率分别为38.7%和73.3%,延迟分别为1468.0和1459.5,在保证精度的同时延迟降低约28% [14][15] - 在跨任务泛化实验中,AsyncThink在4×4数独任务上准确率达到89.4%,延迟为2853.0,优于序列思考和并行思考 [16][17] 消融实验 - 格式微调使LLM学会“语言”,即如何Fork与Join;强化学习使LLM学会“策略”,即何时Fork、如何Join才能更快更准;并发奖励则让LLM学会平衡准确率与延迟的效率 [18][19] 未来工作 - 未来研究将围绕扩展智能体的规模和多样性进行,探索异步思考的扩展定律以及由异构专家工作者组成的大型组织 [21] - 将探索递归智能体组织,使工作者可动态提升为子组织者,以解决深度嵌套的复杂问题 [22] - 将研究人类-AI智能体组织,创建人类-AI协作框架,实现混合智能 [23]