Workflow
MCP 协议
icon
搜索文档
Agent初具技术雏形,重点关注三大演化方向
国投证券· 2025-05-20 08:19
报告行业投资评级 - 领先大市 - A,维持评级 [6] 报告的核心观点 - 人工智能技术迈向自主行动阶段,分为 Agent、具身智能两个方向,聚焦 Agent 梳理技术构成与演进阶段 [1][16] - 2023 年至今模型迭代快,推动 Agent 产品感知、规划、记忆能力提升,成本下降 [1] - MCP 协议有望推动 Agent 工具生态建立,当前处于 workflow 到 Agent 过渡期,类比自动驾驶规则驱动阶段 [2][3] - Agent 产品早期探索,产业链关注模型开源与闭源之争、科技大厂布局、工具层机会 [3] 根据相关目录分别进行总结 技术层:模型与工具能力显著进化,类比自动驾驶规则驱动阶段 - 发展路径:人工智能迈向自主行动阶段,应用场景分 Agent 和具身智能,前者在数字世界交互,后者借助硬件与现实交互 [16] - 关键技术:模型承担感知、规划、记忆职能,工具补充感知信息辅助行动,评估 Agent 关键标准为强大模型能力、强工具拓展性、强工程化能力 [19][20][22] - 模型:2023 年至今迭代快,感知、推理能力提升,成本下降,但存在幻觉问题和上下文窗口不足限制场景 [23][26][33] - 工具:调用工具方式有插件、函数调用、模拟人机交互,MCP 提供标准协议降低成本,A2A 关注 Agent 间通信,二者存在潜在竞争,主导权格局未清 [34][36][43] - 所处阶段:AGI 处于 L2 到 L3 过渡阶段,当前产品多为 AI Workflow,正从其向 Agent 过渡,类比自动驾驶规则到模型驱动演进 [47][50][52] 产业链:商业化模式仍处早期,关注三大主线下动态演化 - 主线 1:模型分闭源和开源模式,闭源能力强,开源成本低,DeepSeek 推动开源生态,开源与闭源之争影响大模型厂商商业化 [56][57][58] - 主线 2:2025 年头部科技大厂在 Agent 布局,产品以领先推理模型为基座,有网页浏览等功能,入局大厂分云厂商、大模型厂商、互联网大厂、硬件终端厂商,基于资源禀赋布局 [61][62][63] - 主线 3:MCP、A2A 推动产业链分化,工具层适合中小公司入局,目前 Agent 产品覆盖多场景,未来走向垂直场景,但模型与工具层边界待清晰 [65][66][67] 投资建议 - 利好算力基础设施,关注商汤、阿里巴巴、腾讯 [11][68] - 端侧硬件换机周期将至,关注小米集团 [11][68] - 端侧芯片性能需求增长 [68] - To C 关注现有 C 端应用和手机助手升级,关注小米集团、腾讯 [11][68] - To B 关注 Mass 软件平台和私有化部署服务商,关注第四范式、商汤、云从科技等 [11][68]
计算机行业深度研究:软件大革命深度:AIAgent投资宝典
民生证券· 2025-05-12 14:33
报告行业投资评级 维持推荐评级 [6] 报告的核心观点 AI Agent是软件革命的关键,解决了生成式AI模型的应用局限,推动AI技术向实用、智能方向发展;互联网巨头争夺Agent超级入口,C端打造多元化产品争夺入口、流量和平台,B端依托自身生态开拓结果导向商业模式;AI Agent打开万亿企业级数字劳动力市场,走入千行百业;2025年将是AI Agent元年,也是软件大革命的起点,Agent或成为软件价值重估的重要催化剂 [3][4] 各章节总结 1 AI Agent:AI时代的软件革命 - AI Agent由模型、工具和编排层构成,是可自主实现目标的应用,其认知架构按核心功能分包括模型、工具和编排层三个基本组件 [3][10] - 目前AI Agent尚处早期发展阶段,自主思考与规划能力不足,传统模式缺乏统一标准,标准化开发与数据互通成行业痛点 [19][22] - 2025年福布斯AI 50榜单发布,AI Agent成核心趋势,截至2024年底渗透率达43%,性能不断提升 [24][26] - MCP协议如同AI应用的USB - C端口,基于类MCP协议的底层数据互通+Agentic - based决策路径定义AI Agent范式,Manus或是集大成作 [28][33][35] - 以MCP为例,协议提供智能体标准化接口,助力科技巨头打造AI生态系统,谷歌、牛津大学等发布相关协议 [39][42][48] - AI Agent付费用户主要在C端与B端,C端更强调通用性和拓展性,B端更强调任务完成度和准确性,按结果付费更适合 [52] - 类似芯片的“摩尔定律”,AI Agent的任务长度或每7个月翻一倍,未来Agent自行开发Agent或成为全新范式 [72][74] 2 十年未见的“无限战争”:互联网巨头争夺Agent超级入口 - 互联网巨头在C端打造多元化AI Agent产品争夺入口、流量和平台,在B端依托自身生态开拓结果导向商业模式 [82] - 腾讯元宝抢占流量入口,ima.copilot聚焦学习和办公场景,腾讯元器打造无门槛智能体创作环境,腾讯基于生态闭环发展“all in one”的AI Agent [84][95][100] - 字节扣子空间聚焦复杂工作场景,Agent TARS开源多模态智能体重塑GUI交互模式 [109][119] - 阿里新夸克引领AI Agent全新生态,阿里云百炼解决本地部署痛点,飞猪AI行程规划能力突出,阿里以阿里云为基座打造AI Agent生态 [126][132][138] - 百度心响APP是通用超级智能体,系统架构创新,MCP实现多智能体互联互通 [150][153][156] - 三六零纳米搜索提升搜索能力,推出MCP万能工具箱,知识库支持一键导入 [159][161][163]
华泰证券 从Agent,到Multi-Agent
2025-03-10 06:49
纪要涉及的行业和公司 - **行业**:AI、计算机行业 - **公司**:华泰证券、微软、Cloud、苹果、腾讯、Workday、ServiceNow、Salesforce、Cruel AI、Mona、OpenAI、亚马逊 纪要提到的核心观点和论据 - **AI商业化进展**:过去两年全球AI商业化主要成果集中在chatbot领域,市场期待的能替代人类执行连续复杂多步骤任务的agent尚未出现,微软Copilot未实现早期演示效果,原因是模型能力和产品工程化问题[2] - **Minus产品影响**:虽非创新模型,但提供在现有模型能力下实现多任务Agent的新思路,引发开源社区对Agent落地应用的关注和复刻尝试[3][4] - **Multi - agent系统**:是AI发展重要方向,通过多智能体协同工作弥补单个智能体能力不足,如Minus系统不同智能体负责不同任务,由不同模型驱动,提高任务自动化执行能力且工程化落地较好[3][5] - **2024年AI技术突破**:在感知、定义、记忆、规划和行动五个环节取得突破,多模态模型增强感知能力,记忆和上下文处理技术升级,思维链方法提升规划能力,行动环节虚拟机形态解决数据源访问问题,Agent编排能力分配任务[3][6][8][9] - **大模型进展**:在推理与行动上进展显著,通过思维链(COT)方法和推理加行动(Reasoning + Acting)的工程实践实现,企业级应用常见人机协作方式[3][10] - **Code Agent发展**:发展相对成熟,能自动完成编码相关任务并集成到IDE环境,应用场景从代码生成扩展到测试和调试等环节[11] - **通用场景延伸**:关键因素是数据权限放开程度,不同数据处理范围作用不同,苹果和腾讯等公司整合个人行为数据提升个性化服务[12] - **MCP协议作用**:为云端系统设计的通信协议,确保agent信息共享和任务协作标准化,苹果预期打通第三方应用数据权限并整合个人行为数据[13] - **Multi Agent系统现状**:初具雏形,技术能力得到验证,工程化准备相对成熟,多Agent生态有望快速迭代发展[15] - **Multi Agent系统构成要素**:由各类agent、合作类型、系统结构、协作策略、协调机制构成,主流采用动态机制协作[16] - **多智能体协同系统运作**:包括环境与上下文感知、协作层、影响因子,目前处于中期模型共享及相互智能能力交换阶段[17] - **多智能体系统合作模式**:包括合作、竞争、竞争合作三种模式,各有特点[19] - **多智能体系统策略分类**:分为基于规则、基于角色、基于模型三种方法,目前主流是基于模型的协作方式[21] - **多智能体系统结构分类**:分为集中式、分布式、层次式三种,集中式架构较为普遍[22] - **多智能体系统协调机制**:包括静态协调和动态协调,动态架构更为常见[23] - **多智能体验例**:Menus产品采用集中式动态决策、基于模型判断的技术架构,包含信息检索、代码生成、数据分析三类agent[24] - **开源多代理框架**:提供预制技术架构及工具集,有任务执行等多个方向,如Cruel AI、Mona等框架具备关键特征[25] - **多智能体开源架构**:包括Python框架、OpenAI的a one架构、微软AutoGen升级版Magical One、亚马逊AWS上的Motion Agent编排器、OWL by开幕AI等,各有特点和不足[27][29] - **企业需求与布局**:企业有复杂任务编排需求,海外To B软件公司如Workday、ServiceNow和Salesforce等在2025年Q4介绍了multi - agent编排系统,产品落地节奏影响商业化变现[28] - **多智能体技术对互联网影响**:将从个体发展成网络,成为下一代互联网重要组成部分,2025年加速产业化,推动计算机行业股票上涨,各大互联网公司纷纷布局[3][29][30] 其他重要但是可能被忽略的内容 - 2023年感知模块早期大模型主要支持文本理解,多模态模型发展增强视觉理解能力;记忆模块围绕长期、短期记忆及上下文处理技术升级,如Cloud推出MMCP协议;规划模块引入思维链方法[8] - 行动环节虚拟机形态以Minus为例可通过编码或操作屏幕获取网页数据,agent编排能力基于角色分配协同工作,如文档编辑项目[9] - 苹果18.3或18.2系统中用户可选择是否允许AI学习其使用APP习惯,为数据打通和行为数据整合做铺垫[13][14]