Agent Infra
搜索文档
智能体落地元年,Agent Infra是关键一环|对话腾讯云&Dify
量子位· 2025-12-23 04:16
文章核心观点 - 2025年被定义为“Agent元年”,行业焦点从年初的宏大叙事转向年末的工程化落地,Agent正从技术萌芽走向务实应用 [1][2][3] - Agent的快速共识源于其能真正解决问题,并伴随一系列工程方法(如Agent Infra、Runtime、架构范式)的快速成型,实现了落地 [12] - Agent落地面临的核心挑战是其作为一个“不确定性的复杂系统”,需要确定性的工程方法(如科学实验思维、Day Two思维)来驾驭 [6][19][20] - Agent Infra是智能体落地的关键一环,它通过解决安全、执行环境、工具、记忆和观测等“偶然复杂度”问题,为Agent的可靠运行和智能进化提供支撑 [5][23][38] Agent发展阶段的总结 - Agent发展已从年初硅谷的“宏大叙事”和“立法阶段”(靠Demo吸引资本),进入年末充满“烟火气”的“司法阶段”,处理具体、琐碎的执行问题,走向务实 [6][9][10][11] - 行业发展并非线性进步,而是“根茎状的蔓延”,秩序的建立更多依赖于产品工程、提示词工程、RAG、Pipeline等“胶水”技术 [12] - 共识的形成部分源于资本在互联网红利见顶后,寻求新的组织方式,Agent承诺了“交互成本的坍塌” [12][13] Agent落地与AI落地的区别 - 范式发生明显转移:从传统的if/else逻辑判断和确定性功能交付,转向Agent的“概率性目标规划”和“概率性能力”交付 [14][18] - 关键区别在于“新增了很多不确定性”:Agent的失败是对意图的误解或概率漂移,修复方式从“修Bug”变为像“教育孩子”一样进行约束 [18] - Agent是一个由模型、架构、Prompt、工具等七八个因素相互影响构成的“不确定性的复杂系统”,其输出具有不确定性,与传统微服务系统相反 [19] Agent Infra的角色与关键要素 - Agent Infra的核心作用是解决企业在Agent落地中遇到的“偶然复杂度”问题,而非业务本身的本质复杂度 [6][23] - 当前Infra层致力于构建解决偶然复杂度问题的“最大公共子集”,包括:安全、执行环境、工具、记忆和观测 [23] - 在Agent Infra中,“安全”尤其是“Agent的自主运行”带来的破坏性风险是最突出的问题,需要多层次、全链路的安全体系(如安全沙箱)来解决 [21][25][26] - 对于Infra的开闭源选择呈现分层互补:初创公司和创新者倾向于开源以获得低成本、灵活性和透明度(白箱);大企业则倾向于商业版或闭源以获得责任转移与兜底服务 [27][28][29] 技术进展与未来趋势 - **AI代码工具**成为标志性实践和重要趋势:它不仅是解决代码问题的工具,更成为Agent连接现实世界的通用接口,并颠覆了原有的软件工程范式,推动从AI Coding到AISE(AI软件工程师)的转变 [7][33][34] - 技术正在从开发者向非开发者移动,简化程度逼近“AI开发的Excel时刻”,将基础设施认知负荷降至最低,使开发者能聚焦于Prompt和数据治理 [31][35] - Agent Infra的下一步重点是从“服务好Agent的运行构建”转向“服务好Agent的智能进化”,关注其安全可靠运行,并利用运行数据持续优化Agent本身和模型 [38] - 未来重点方向可概括为:**秩序**(让混乱模型可控)、**连接**(打通Agent孤岛融入业务)、**自动**(任务自动化)、**安全高效**、**智能进化**、**人机协同** [39] - 记忆管理需要超越简单的向量搜索,关注语义化的情景记忆和可计算的时间观,将记忆和目标视为可重写、降级的变量并进行置信度处理 [40] 对开发者和企业的影响与门槛 - 对于中小公司和个人开发者,最大的门槛并非技术或成本,而是**缺乏开始的勇气**以及企业**数据的壁垒**;同时,**商业模式**的探索和转变是关键,因Agent尚未到全面改变社会商业模式的阶段 [6][40] - 对于专业开发者和AI原生企业,Infra产品主要帮助治理其面临的复杂问题,加速Agent落地 [31] - 若Agent成为主流,将对移动开发生态产生影响:公司会要求在APP中集成Agent能力,促使开发者思维从工程转向科学实验;利用AI Coding工具开发APP则要求改变协同模式和工具体系 [41][44] - 未来的应用交互形态(如iOS/Android)尚无定论,但只有那些与AI工具为伍、改造研发流程并用科学实验思维驾驭不确定性的人,才能抓住形态转移的机遇 [42][43]
Agent应用爆发,谁成为向上托举的力量?
36氪· 2025-08-06 10:31
AI Agent发展现状 - AI Agent正从被动响应迈向主动决策 成为连接数字世界与物理世界的核心枢纽 [1] - 具备推理、规划、记忆与工具使用能力的智能体正在重塑产业形态 涵盖企业Agent、学术Agent和个人Agent [1] - 2025年AI Agentic基础设施迎来爆发拐点 开源大模型突破提供认知"大脑" 模型上下文协议生态繁荣赋予灵活"四肢" [1] - 全球80%企业将在年内部署Agent 大脑与四肢的协同进化倒逼基础设施全面升级 [1] 企业应用痛点 - 早期RPA产品只能自动化简单单一工作流程 不具备真正智能且不能解决复合化复杂问题 [3][4] - 生成式AI出现后真正具备智能的Agent应用带来效率提升 但网页或App形式不适合专业开发者与企业用户 [5] - 本地部署面临五大核心痛点:AI推理算力限制、任务执行算力弹性不足、工具配置复杂、权限冲突问题、安全性差 [5][6][7][8][9] - 消费级设备无法部署高精度大模型 云端算力成为主流方案但存在弹性扩展难题 [6] - 超过43%的MCP服务节点存在未经验证Shell调用路径 83%部署存在配置漏洞 88%AI组件未启用防护机制 [9] - Agent缺乏长期记忆影响业务使用范围 语义记忆和场景记忆缺失限制任务完成能力 [10] 基础设施解决方案 - 云厂商竞相推出新一代Agent Infra架构:AWS AgentCore解决长时执行与状态记录 Azure AI Foundry集成Serverless计算 Google Vertex AI优化长时运行需求 [12] - 阿里云函数计算Function AI提供自主选择模型与工具的组装式设计 PPIO推出国内首个Agentic AI基础设施服务平台 [13] - 新一代基础设施聚焦长时运行、会话亲和、会话隔离、企业级IAM和VPC及模型框架开放等技术突破 [18] - 突破传统Serverless执行时长限制(如AWS Lambda15分钟上限)支持数分钟至数小时连续工具调用 [18][19] - 通过状态持久化、冷启动优化和开放集成解决LLM Agent持续推理、Workflow Agent状态流转和Custom Agent灵活定制需求 [22] - 开发范式从手动拼凑传统组件转向利用原生Infra实现高效安全可扩展的开发部署 [23] 市场机遇与发展趋势 - Agent Infra成为模型公司、云厂商和初创公司积极拓展领域 创业公司存在显著机会 [24] - 机会存在于现有Infra的AI-native需求环节 包括更快冷启动速度、更强隔离性及更好的AI workflow结合 [24] - 易用性高且价格合理的Infra产品有望被广泛采用 因Agent开发追求研发投入ROI [24] - 基础设施持续创新推动Agent生态共建 使开发变得像组装乐高积木一样便捷 [24]
Agent Infra 图谱:哪些组件值得为 Agent 重做一遍?
海外独角兽· 2025-05-21 12:05
核心观点 - Agent Infra需求爆发,开发范式正在重构和收敛,四大赛道值得关注:Environment、Context、Tools、Agent Security [3][13] - 创业公司机会在于:1) 在已有Infra中寻找真正Agent-native需求 2) 抓住Agent开发中新痛点 [4][5][16][17] - 云厂商积极布局但尚未出现Agent-native产品,初创公司在细分领域有差异化机会 [63][70] 投资主题1:Environment - Sandbox需满足更高性能要求:隔离性、启动速度、稳定性及AI性能如代码解释器功能 [20] - E2B提供AI-native microVM获Perplexity等头部客户认可 [20][21] - Modal提供Cloud-native虚拟机适合规模化需求 [20][21] - Browser Infra分两类:1) 大规模浏览网页 2) 深度操纵网页 [22] - Browserbase平衡带宽价格速度获开发者青睐 [23][25] - Browser Use新兴公司让Agent像人一样深度操作网页 [24][25] 投资主题2:Context - RAG已成共识技术,Glean估值近70亿美元专注企业内数据搜索 [29][30] - MCP协议标准化工具调用,早期机会在: - 自动生成MCP Server如Mintlify [31][33] - MCP connector如Composio托管100+ Server [31][33] - Marketplace价值较薄可能集成至开发端 [32] - Memory分短期/长期/程序记忆,Letta通过Sleep-time预处理提升推理质量 [34][36][38][40] 投资主题3:Tools - Search & Scraping: - Agent搜索量将远超人类,需AI-native方案 [45] - 机会在廉价API(博查)、智能搜索(Exa)、爬虫架构(Firecrawl) [45][46][47] - Finance & Payment: - Skyfire让Agent具备支付能力类比"AI经济Visa" [49][51][53] - Paid按产出定价重构货币化机制 [52][53] - Backend Workflow: - Supabase一站式后端服务吸引200万开发者 [54][56] - Inngest简化工作流编排获a16z投资 [56] 投资主题4:Agent Security - 需动态意图分析及数据校验,当前以老牌玩家为主 [57][59] - Chainguard提供安全容器镜像 [59][61] - Haize Labs压力测试增强稳健性 [59][61] - 生态完善后AI-native机会更清晰,当前偏早 [60] 云厂商布局 - Environment: - AWS Nitro Enclaves/Azure Container Apps/GCP Cloud Functions均非Agent-native [63][64][65] - Context: - AWS Bedrock/Azure Cognitive Search/GCP Vertex AI推动企业上云 [66][67] - 三大云厂商均推出MCP相关产品与A2A协议互补 [68][69] - Tools: - AWS Step Functions/Azure Logic Apps/GCP Workflows未体现Agent特性 [70][71]