多智能体系统(MAS)

搜索文档
AI Agents与Agentic AI的范式之争?
自动驾驶之心· 2025-09-12 16:03
AI智能体发展演进 - ChatGPT于2022年11月发布彻底改写AI发展轨迹 AI Agents与Agentic AI搜索热度自2022年底起持续飙升 [2][4] - 早期智能体如20世纪70年代MYCIN系统依赖符号推理和预设规则 缺乏学习能力和自主适应性 [10] - 多智能体系统MAS与BDI架构在1999年后发展 智能体被定义为具备自主性 感知力与通信能力的实体 但仍受预编程限制 [11] - 2023年AutoGPT BabyAGI等框架标志AI Agents落地 结合LLM与外部工具自主完成多步骤任务 [12] - 2023年底CrewAI MetaGPT系统推动进入Agentic AI阶段 多专业智能体协同分工 [12] - 谷歌2025年提出Agent-to-AgentA2A协议 制定五大核心原则 包括发挥智能体能力 保障交互安全 支持长期任务等 [12] AI Agents核心定义与特征 - AI Agents是由LLM和LIM驱动的模块化系统 用于特定任务自动化 填补生成式AI只会说不会做的空白 [13] - 具备三大核心特征 自主性无需持续人工干预 任务特异性聚焦单一明确领域 反应性能响应动态环境变化 [16][17] - 技术基石为LLM与LIM双引擎驱动 LLM承担推理与决策中枢角色 LIM延伸视觉感知能力 [21] - 工具集成解决LLM静态知识和幻觉问题 过程分为调用-结果整合两步 ReAct框架实现推理与行动交替 [19] - Anthropic的Computer Use项目让Claude模型操作电脑 通过目标-行动-观察循环完成任务 [18] - AutoGPT处理产品市场分析时依次调用网页搜索 Excel 报告生成工具 GPT-Engineer自动生成代码并测试运行 [20] Agentic AI系统级突破 - Agentic AI是多智能体协作革命 核心在于通过多智能体协作解决复杂任务 实现从孤立执行到协同决策的范式转变 [24][27] - 与AI Agents的本质区别在于引入系统级智能 具备动态任务分解 多智能体分工 协同与适应三大能力 [33] - 架构依赖协调层与共享记忆双支柱 协调层由元智能体担任 共享记忆分为情景记忆 语义记忆和向量记忆 [36] - 多智能体科研助手如AutoGen框架自动分配检索 总结 整合 写作 引用智能体协作撰写综述 [37] - 智能机器人协调在果园采摘场景中 包含无人机测绘 采摘机器人 运输机器人和路径规划智能体 [37] - 医疗决策支持在ICU场景中 由监测 病史 治疗和协调智能体构成 减少医生认知负担和误判风险 [38] 应用场景对比 - AI Agents适用于客户服务聊天机器人 虚拟助手 自动化工作流程等单一明确任务 [28][30] - Agentic AI适用于供应链管理 业务流程优化 虚拟项目经理等复杂多步骤任务 [28][30] - AI Agents在企业场景中应用于客户支持 电子邮件筛选 个性化内容推荐 自主日程助手等模块化任务 [41] - Agentic AI在科学 农业 医疗 信息技术安全等领域实现可扩展自主化任务协同 如自动化基金申请 果园采摘 ICU临床决策 网络安全事件响应 [43] 技术挑战与解决方案 - AI Agents面临因果推理缺失 LLM固有缺陷幻觉 知识滞后 提示敏感性 长期规划能力弱等痛点 [50] - Agentic AI新增误差传递 协调瓶颈 涌现行为不可预测 可解释性差等挑战 [50] - 十大核心解决方案包括检索增强生成RAG ReAct框架 因果建模 共享记忆架构 元智能体协调 工具验证机制 程序式提示工程 反思机制 监控与审计pipeline 治理架构 [49][52][53] 未来发展路线 - AI Agents进化重点包括提升主动推理能力 深化工具集成 强化因果推理与持续学习 [57] - Agentic AI突破方向包括规模化多智能体协作 领域定制化 伦理治理 [57] - 颠覆性探索如Absolute ZeroAZR框架实现零数据学习 智能体自主生成任务并验证优化 [57] - 终极方向是从自动化工具进化为人类协同伙伴 需突破因果推理深度化 可解释性透明化 伦理安全体系化三大瓶颈 [58][59]
ICML 2025 | 多智能体的ChatGPT时刻?上交MAS-GPT实现工作流一键生成
机器之心· 2025-07-05 02:46
多智能体系统(MAS)发展现状 - OpenAI将"组织级智能(Organizational AI)"设定为通向AGI的第五阶段,多智能体系统是实现该目标的重要探索方向[1] - 现有MAS方法(ChatDev/DyLAN/AFlow等)存在三大根本问题:结构依赖人工调试、多轮LLM调用成本高昂、泛化性低[5][7] - 当前处理大规模并发请求的类ChatGPT系统若采用传统MAS范式,可扩展性与鲁棒性将无法满足需求[5] MAS-GPT技术突破 - 提出生成式MAS设计范式,通过一句Query即可自动生成可执行的多智能体系统,构建过程"像与ChatGPT聊天一样简单"[2][4][9] - 将MAS设计转化为语言生成任务,输出为Python代码实现的完整系统,实现"模型写MAS"而非人工编写[9] - 基于11K高质量数据样本进行监督微调(SFT),训练出MAS-GPT模型[10] 性能优势 - 在8个基准任务×5种主流模型的对比中,平均准确率较最强基线提升3.89%[16][17] - 推理成本仅为竞品的0.5倍,在GPQA/SciBench等未见任务上保持稳健表现[17][18] - 与OpenAI o1/DeepSeek-R1等强推理模型结合时,在AIME-2024数学挑战中分别提升13.3%和10.0%[22] 技术特性 - 具备极强兼容性,生成的MAS适配任何LLM驱动均能带来性能提升[20] - 可自动生成新颖MAS结构,为未见任务设计合理分工协作方案[24][29] - 为每个MAS附加推理说明,解释设计逻辑[29] 行业影响与发展 - 开创"为每个Query自动生成MAS"的新范式,理论上可整合领域内所有多智能体系统[25] - 成立MASWorks开源社区,连接全球研究者推动MAS领域发展,将在ICML 2025举办MAS-2025研讨会[28][30][31] - 随着基座模型能力提升和数据丰富,未来可能实现为每个问题量身定制智能系统的愿景[26][27]
低空经济与卫星互联网安全专题论坛举行
搜狐财经· 2025-05-31 10:55
低空经济发展与数字化转型 - 中国低空经济将进入万亿级市场,具有辐射面广、产业链条长、成长性强、带动性强等特点 [2] - 低空经济发展需全面认识无人机的安全性并加强风险防控 [2] - 无人机事故频发已成为制约产业发展的瓶颈,需构建"政府监管+产业防护+公众意识"三位一体的协同体系 [2] 无人机集群协同与安全技术 - 多智能体系统(MAS)与大型语言模型(LLM)在无人机集群协同中有创新应用,可解决广域监控、动态物流等场景的覆盖不足和实时性差问题 [3] - 身份认证、通信加密等安全机制对无人机集群系统稳定性至关重要 [3] - 未来研究将深化MAS+LLM融合,推动无人机集群向智能化、自主化与高安全性发展 [3] 卫星通信与无人机应用 - "空天一体"通信架构推动传统无人机在远距离、复杂环境下的应用 [3] - 卫星互联网网络攻击手段日趋多样,卫星通信链路复杂性增加,用户端流量管控需求强烈 [3] - 构建高效、可靠的安全防护体系是卫星互联网发展的重要课题 [3] 行业合作与未来展望 - 2025年将深耕低空经济与卫星互联网安全领域,深化"空天地一体化"安全生态布局 [5] - 产业链上下游伙伴、高校及科研院所将携手共建技术标准与创新应用,开拓低空经济新场景 [5] - 《2024卫星互联网安全年度报告》发布,推动低空经济与卫星互联网安全领域系统化、智能化发展 [5]
基于奖励驱动和自组织演化机制,全新框架ReSo重塑复杂推理任务中的智能协作
机器之心· 2025-04-27 10:40
研究背景 - 增加推理时间被认为是提升大语言模型推理能力的重要途径,包括引入强化学习与奖励模型优化单一模型的推理路径,以及构建多智能体系统协同解决复杂任务 [5] - 多智能体方法理论上更具灵活性与可扩展性,但面临自动扩展能力不足、智能体能力评估困难、奖励信号设计粗糙、缺乏动态演化机制等挑战 [7][8] ReSo框架核心创新 - 提出奖励驱动的自组织多智能体系统ReSo,能够自主适应复杂任务和灵活数量的智能体候选,无需手动设计合作解决方案 [12] - 引入协作奖励模型(CRM),提供细粒度奖励信号实现数据驱动的多智能体系统性能优化 [12] - 采用任务图生成与智能体图构建的两阶段方法,将复杂问题分解为有向无环任务图(DAG),再为每个子任务匹配最佳agent [11][15] 技术实现细节 - 任务图生成:使用大语言模型将复杂问题转化为分步骤的有向无环任务图,测试了闭源模型(gpt4o)和开源LLM(Qwen-7b) [16] - 两阶段智能体选择:粗粒度搜索采用UCB算法筛选候选智能体,细粒度筛选通过CRM评估候选智能体实际表现 [20][23] - 动态智能体数据库(DADB)存储智能体基本信息、历史性能及计算成本,用于生成初步质量评分 [19] 实验结果 - ReSo在Math-MAS-Hard和SciBench-MAS-Hard上的准确率分别达到33.7%和32.3%,显著优于其他方法 [36] - 在复杂推理任务中表现全面优于现有MAS方法,如MetaGPT、DyLAN、GPTSwarm等 [37] - 与单模型相比,ReSo在保持较高准确率的同时,展现出更强的适应性和可扩展性 [37] 数据集贡献 - 提出自动化方法生成多智能体任务数据,包括随机生成任务图、填充子任务及构建自然语言依赖关系 [32] - 开源MATH-MAS和Scibench-MAS数据集,单个样本包含多学科任务,复杂度分为3、5、7三个级别 [32]
巨头抢滩AI智能体,资本沸腾了
投中网· 2025-03-12 04:49
AI Agent市场概况 - AI Agent技术实现从"被动应答"向"主动执行"的范式跃迁,Manus验证了通用型AI Agent在复杂场景下的商业化可行性[8] - 2024年全球AI Agent市场规模约51亿美元,预计2030年达471亿美元,复合年增长率44.8%[9] - AI Agent通过"规划-验证-执行"架构将大模型认知能力转化为生产力工具,突破传统大语言模型无法闭环执行任务的局限[8][11] 技术突破与应用场景 - AI Agent具备人类思维范式,能理解指令隐含需求并执行复杂任务(如结合季节/活动推荐酒店)[11][12] - 多模态技术突破将扩展应用至医疗诊断、自动驾驶等高价值领域,未来可能通过多智能体系统(MAS)实现专业化分工协作[12][13][14] - 典型案例包括Manus在GAIA基准测试表现优异,OpenAI推出月费2万美元的"博士水平"Agent服务科研场景[18][28][30] 行业竞争格局 - 科技巨头密集布局:谷歌发布Gemini2.0及ProjectAstra,微软推出Copilot Studio平台,阿里千问QwQ-32B集成智能体能力[17][18] - 开源社区涌现OpenManus、OWL等产品,推动技术民主化[18] - 资本市场反应剧烈:Manus发布当日A股超150只概念股涨停,酷特智能等个股涨幅超20%[20][21] 现存技术挑战 - AI幻觉问题突出:GPT-4.5在SimpleQA测试中准确率62.5%但幻觉率7.1%,医疗领域3%误诊率可能造成30万例误诊[31][32] - 数据孤岛制约通用能力,金融/医疗等领域数据割裂导致跨场景迁移困难[33] - 伦理监管滞后,自主决策涉及隐私泄露、责任归属等未解决问题[33]