Agent元年复盘：架构之争已经结束！？

文章核心观点 - 2025年是Agent技术稳步落地的“Agent元年”，技术已就绪，爆发在局部，行业处于从技术架构探索向业务重塑过渡的中间态 [5][6][10] - Agent技术架构之争已定，收敛至以Claude Agent SDK和LangGraph的Deep Agent为代表的“通用型Agent”形态，其核心特点是主从架构（Main-Sub Agent）、自主规划、独立文件系统和上下文自动压缩 [3][57][58][59] - 构建有价值的“Deep Agent”需要满足两大特征：一是“够垂”，即具备源于行业深度实践的专业知识；二是“Long-running”，即能稳定、长时间运行并执行多步骤复杂任务 [11][12] - 将通用型Agent转化为垂类Agent的关键在于通过“Agent Skills”等优雅方式将业务知识丝滑融入，并通过分层工具调用、精细化的系统提示词工程来管理复杂度和确保稳定性 [22][41][52][62] 技术架构收敛与通用型Agent形态 - 技术架构在2025年10月后已收敛，标志是以Claude Agent SDK和LangGraph的Deep Agent为代表的架构 [57] - 收敛后的通用型Agent架构具备四大支柱：主从架构（Main-Sub Agent）、自主规划能力、独立的文件系统概念以及上下文自动压缩机制 [58][59] - 上下文自动压缩指当Token使用量达到上限（如200k）的80%时，系统会自动调用总结模型进行摘要压缩以释放空间 [59] - 分层工具调用是解决上下文拥挤的关键，例如Manus架构通过原子层、沙箱工具层和代码/包层三层设计，避免一次性灌输超100个工具导致的上下文混淆 [62][66][67] Deep Agent的核心特征与定义 - 特征一：行业性（够“垂”）：Agent的知识和能力必须源于行业的深度实践和共识，包括业务定义的理想态、过往案例积累以及行业潜规则，其输出应达到或接近高级专家的水准 [11][12] - 特征二：Long-running（稳定性）：包含两个关键维度，一是能长时间持续运行而不崩溃（如连续运行24小时），二是能连续、保质保量地执行涉及大量工具和API调用的多步骤复杂任务 [12] - 定义：一个Deep Agent首先是一个Agent，其公认定义是“一个能循环运行工具以实现目标的LLM代理” [13][14] 构建Deep Agent的关键维度与方法 - 维度一：业务知识融合：传统方法如融入Prompt或使用企业知识库（RAG）不够丝滑，Anthropic提出的“Agent Skills”提供了一种优雅解法，它通过多层级的文件系统封装指令和资源，让Agent能动态发现和加载，实现渐进式披露 [22][26][29][32] - 维度二：实现Long-running：LangGraph的Deep Agent包提出了四大方法，包括规划、子代理、系统提示和文件系统，它们相辅相成，共同构成核心运作机制 [44][47][48][52][55] - 具体方法： - 规划：允许代理将复杂任务分解为步骤，跟踪进度并调整计划，以执行更长时间跨度的任务 [47] - 子代理：用于实现上下文隔离、并行执行、专业化分工和提升Token效率，架构已收敛为由一个超强主代理按需调用子代理的模式 [48][49][50] - 系统提示：最优秀的Agent拥有非常复杂详细的系统提示，用于定义规划标准、调用子代理的协议、工具使用规范及文件管理标准，通过提示工程承载应用复杂性 [52][53][54] - 文件系统：用于上下文卸载、作为共享工作区、存储长期记忆以及封装可执行的技能或脚本 [53] Agent与Workflow的对比及开发范式转变 - 本质区别：是复杂度的转移，Workflow将业务逻辑显式构建为“有向图”，而Agent将其抽象为自然语言，复杂度从“流程编排”转移到了“Prompt设计” [19] - 核心一致：无论选择Workflow还是Agent，都在实践“Test-Time Scaling Law”，即通过良好的上下文工程，让模型消耗更多Token以换取更强的能力或更高的准确率 [20] - 开发范式：相较于传统微调（SFT）动辄两周的周期，Agent模式跳过了耗时的数据准备，将迭代周期从“周级”压缩至“天级”，本质是通过消耗Token来换取效果的快速迭代 [74] 行业落地现状与挑战 - 验证过的成功：如Deep Research和Claude Code已完全融入日常工作流，成为稳定可靠的生产力工具 [10] - 看不见的繁荣：在招聘、市场营销、医疗等垂直领域，许多Agent产品早已实现百万美元营收，但由于大量业务集中在出海方向，导致国内体感不强 [10] - 核心瓶颈变化：当前真正挑战在于“业务重塑”，即需要懂技术的一线从业者将传统SOP和行业知识解构，以Agent友好的方式沉淀为新工作流 [10] 从通用型Agent到垂类Agent的业务实践 - 升级路径：将现有Workflow升级为Agent主要包括三步：1) 将业务文档、SOP抽象为Skills并存储在文件系统中；2) 将业务API封装为MCP服务；3) 为Main Agent和Sub Agent编写极度详细的系统提示词 [71] - 架构参考：可模仿Claude Deep Research的主从Agent（Main-Sub Agent）Prompt架构，将复杂业务流程通过详尽的系统提示沉淀到主代理的认知体系中 [72] - 模型依赖：这种方式的有效性高度依赖最先进的模型（如Claude 4.5、Gemini 3、GPT-5.2），若无法获得，则需降低任务复杂度进行尝试 [73]