Agent
搜索文档
为了让企业用好AI,云厂商们操碎了心
36氪· 2025-12-31 13:35
行业核心驱动力 - AI正在重塑整个云市场,成为云厂商增长的核心驱动力[3] - 越来越多的行业和企业意识到利用AI优化业务效率、创造价值的可行性,并急于付诸实践[3] - 云厂商的核心价值正从基础设施提供者转变为AI能力提供者,卖Token成为关键增长途径[1][6] 市场增长与规模 - 阿里云的AI相关收入已连续9个月实现三位数同比增长[1] - AWS判断未来MaaS平台带来的Token收入将和其EC2计算产品的收入不相上下[1] - 谷歌云的年化收益超过500亿美元,其中大部分增长由AI驱动[1] - 火山引擎将其千亿营收目标(原预计2029-2031年实现)上调了数百亿美元[1] - CoreWeave依靠AI算力租赁业务获得了数百亿美元市值[3] 竞争格局与战略动向 - 新锐云厂商正以更敏捷的动作拥抱AI,冲击原有行业格局[1] - 火山引擎坚持锚定「AI云」,将其视为重要的超车机会[1] - CoreWeave通过收购增强AI算力租赁之外的AI开发能力[1] - 腾讯和百度近期针对基础模型研发进行了团队调整,以加强投入[11] Agent成为价值焦点 - AI对企业的价值体现越来越集中在Agent的打造上[3] - Agent为发挥Token的价值提供了方法论和路径,是让Token产生价值的关键[4][6] - 未来几乎所有与计算世界打交道的软件都可能由大模型产生的Agent构成[4] - 行业对Agent市场给予积极乐观的预期,预计明年将呈现爆发式增长[4] Agent应用案例与效率提升 - AWS借助编程Agent Kiro,将一个原本需要30人工作18个月的项目缩短至6人用76天完成[4] - 火山引擎的一个企业客户在2024年开发了50多个Agent,到2025年增至200多个[4] - Blue Origin构建了超过2700个内部Agent,交付效率提升了75%[4] 企业面临的挑战 - 能够真正开发好、运营好并大规模使用Agent的企业并不多,通常需要深厚的技术积累[6] - 第三方调研数据显示,93%的客户在从概念验证迈向生产阶段时遇到重大障碍[6] - 主要障碍来自数据层面(概念验证数据经过优化)和工程化层面(大规模应用对安全、扩容等要求更高)[6] 云厂商的解决方案布局 - 云厂商正积极布局打造更完备、简便的Agent开发和落地能力[3] - 方向包括提供帮助企业高效搭建Agent的工具包,涉及模型定制化训练、Agent开发、运营和安全治理[3] - 需要一套为Agent开发和运行而设计的AI云原生架构来支持企业[7] 全栈式Agent开发平台 - 火山引擎推出了包含MaaS层易用性提升(Prompt Pilot、Response API)、推理代工、AgentKit全栈开发能力和HiAgent运营能力的完整解决方案[7] - AWS推出了开放式模型训练平台Nova Forge和企业级Agent开发框架AgentCore[7] - 谷歌云的Gemini Enterprise提供基础模型、无代码构建框架、专业Agent等六项核心组件,实现端到端Agent应用[7] - 腾讯云推出智能体开发平台(ADP),支持低代码/无代码构建[10] - 阿里云推出Agent开发框架ModelStudio-ADK,支持开发复杂Agent[10] - 百度云通过千帆平台提供完整的训练调优、推理部署等工具链[10] 平台能力关注重点 - 普遍重视降低Agent开发门槛、提升模型定制化能力和加强Agent安全控制[9] - AWS的Nova Forge允许企业基于自有数据训练模型,知识产权归企业所有[9] - Reddit、Booking和索尼已是Nova Forge的早期用户,Reddit训练的模型能理解小众文化[9] 基础模型演进 - 强大的自研基础模型是企业选择云平台的重要参考项[11] - 进化趋势是让基础模型更适配Agent开发需求[11] - 火山引擎豆包大模型1.8针对多模态Agent场景优化,增强了工具调用和复杂指令遵循能力[11] - 谷歌Gemini 3 Pro具备更强的自主规划、拆解任务和调用工具能力[11] 云厂商理念与指标转变 - MaaS业务的进展正在成为云厂商的一项核心指标[13] - 火山引擎已将AI的Token调用量视为核心指标,有销售因MaaS业务不佳而被淘汰[13] - 阿里云在11月传出提高MaaS业务优先级,将其作为业务长期成功关键指标的消息[13] - 阿里云提出要做「AI时代的Android」和「超级AI云」[13]
2025AI应用大爆发,2026普通人有什么机会?
36氪· 2025-12-26 08:59
全球AI产业现状与利润结构 - 当前AI产业利润分配严重失衡,英伟达攫取市场近九成利润,下游应用开发和模型训练企业面临天价算力成本且难以盈利,导致“头重脚轻”的利润结构,影响生态健康循环[3] - 企业生成式AI(GenAI)支出从2024年的115亿美元跃升至2025年的370亿美元,年增长约3.2倍,约占全球SaaS市场6%[3] - 过去6个月AI产业迭代速度远超去年,正处于技术周期关键拐点,核心趋势是模态融合,多模态调用量占比持续攀升,生图、生视频能力增长迅猛[3] AI应用市场增长与商业化梯队 - C端应用增长显著,2025年全球用户在ChatGPT移动应用上的支出约为24.8亿美元,较2024年的4.87亿美元同比增长408%,从推出到达到30亿美元消费者支出仅用31个月,速度快于TikTok(58个月)、Disney+(42个月)和HBO Max(46个月)[4] - 全球AI应用商业化形成清晰梯队:第一梯队由通用大模型主导,OpenAI以100亿美元年度经常性收入(ARR)位居全球第一,2023-2025年预期收入复合增长率(CAGR)达260%,其核心产品ChatGPT贡献超60%收入;Anthropic以40亿美元ARR位列第二,2024年底至2025年7月收入增长3倍,但以B端API调用为主(占比70%-75%)[5] - 国内应用处于第二梯队(ARR 1-10亿元),垂类应用(如AI编程、多模态、AI搜索)因场景明确、降本效果显著成为商业化主力[5] - 从7月到11月,超过200款AI应用面世,其中AI应用插件、PC网页端、AI原生APP占比分别为81.5%、10.7%、7.8%;应用方向以AI图像处理(24.9%)、AI专业顾问(18.5%)、AI效率办公(6.8%)、AI社交互动(5.9%)、AI文案写作(5.9%)为主[6] 中美AI应用发展与收入差距 - 在全球前50个生成式AI App中,有22个产品由中国团队开发,但仅3个主要在中国使用,中国公司如美图(贡献5个产品)和字节跳动(拥有豆包、Cici、Gauth、Hypic等)是重要参与者[8] - 字节跳动旗下产品Dola(豆包海外版)和DeepSeek分别以4700万和3900万月活跃用户(MAU)位列全球第四和第五[6] - 中美AI应用收入存在十倍乃至百倍的差距,主要原因是美国市场拥有成熟的软件付费生态,用户更愿意为闭源软件长期付费,且美国科技巨头(如OpenAI、Google)聚焦通用智能底层探索,谷歌、微软、AWS形成了从芯片、框架到云服务的全栈闭环[8] AI技术发展重点与趋势 - 行业核心变化是从“概念炒作”进入“价值兑现”,不再单纯卷模型能力,而是关注成本效率、推理能力与用户体验[9] - 具体表现为:DeepSeek以极致成本效率击穿算力与规模神话;GPT-5将“推理”从能力升级为系统能力;Gemini 3证明顶级模型竞争持续;Qwen3在开源生态中持续扩张;AIGC(图像、视频生成)从“展示能力”走向被用户大量使用[9] - 大模型成本快速下降,例如GPT-4成本从60美元/百万token降至GPT-5.1的1.25美元,国产模型GLM-4.6成本更压至0.3美元/百万token[20] AI Agent(智能体)的落地现状与挑战 - Agent落地应用的最大障碍已从成本问题转变为“质量”问题,即如何输出可靠、准确的内容[11] - 质量挑战具体指Agent的准确性、相关性、输出一致性,以及维持适切语调、遵循品牌或政策规范的能力,有三分之一的受访者视其为主要瓶颈;延迟是第二大挑战,占比20%[13] - 大型企业(万人以上)在Agent部署上领先,67%已投入生产,24%正在积极开发;百人以下小公司该比例分别为50%和36%[11] - 目前Agent应用主要限于编程和客服等高人力成本场景,降本效果显著但增收不够明显[14] AI在具体行业的落地应用与案例 - AI SaaS企业通过满足中小商家未被满足的需求实现商业化,例如筷子科技通过智能体和托管服务,以GMV抽佣方式服务预算有限的品牌商家[14] - 具体案例:广州市一家汽车美容店使用AI工具,半小时内生成100多条个性化视频,新客源在一周内同比增加50%,获客成本远低于传统模式[14] - AI落地不是全流程颠覆,而是技术与产业需求逐步校准磨合的过程,企业应聚焦“小切口、高适配、高收益”的场景[15] AI动漫(漫剧)赛道机遇与现状 - AI动漫赛道受资本市场看好,2025年10月底多家头部券商发布研报看好该赛道,视频平台(芒果、抖音、B站等)和内容公司(如阅文集团)竞相入场[16] - AI动态漫制作成本大幅下降,单分钟生成成本从纯人工时期的数万元压缩至千元以内(最低600-700元),整部作品制作成本降至5万-10万元,仅为传统动态漫的10%-30%[17] - 该赛道盈利能力显现,AI漫剧的全域经营投流投资回报率(ROI)普遍达到1.1-1.8倍[16] - 行业马太效应明显,2025年6-8月数据显示,累计播放量破千万的漫剧仅占12%,而64%的作品播放量不足100万;一部播放量破千万的付费AI漫剧净利润可达20万至30万元[19] 对普通人与创业者的启示 - 当前AI应用已到“傻瓜级应用级别”,普通人可通过提示词和内容调试使用,但成功关键在于理解业务场景而非单纯技术[16] - 对于AI动漫创业,操作流程(选择故事脚本、确认风格与分镜、生成画面、剪辑视频)已趋于简化,但核心竞争力仍在于题材新奇和故事好,需要导演与编剧思维[18][19] - 固定价格的端侧设备能运行的AI模型参数量每88天翻一番,成本降低与性能提升是必然趋势[20] - AI+的关键在于增效而不仅是降本,应选择有增长潜力的行业而非夕阳行业进行应用[20]
LangChain Agent 年度报告:输出质量仍是 Agent 最大障碍,客服、研究是最快落地场景
Founder Park· 2025-12-22 12:02
行业核心观点 - 2025年,AI Agent大规模应用的主要障碍已从成本转向输出质量,确保其输出可靠、准确是最大挑战[1] - 进入2026年,行业讨论焦点已从“是否采用Agent”全面转向“如何规模化、可靠且高效地应用”[2] Agent采用现状与趋势 - 超过一半(57.3%)的受访者已将Agent投入实际生产,另有30.4%正在开发且有明确上线计划,行业正从“概念验证”快速迈向“价值实现”阶段[4][5] - 规模越大的企业,Agent落地速度越快:万人以上大型企业中,67%已将Agent投入生产,24%正在积极开发;而百人以下小公司的比例分别为50%和36%[6] - 客户服务(26.5%)与研究及数据分析(24.4%)是目前最主流的Agent应用场景,两者合计占据所有应用场景的一半以上[10] - 在万人以上的大企业中,提升内部生产力(26.8%)反超客户服务,成为第一大应用场景[13] - 今年的应用场景分布更广,表明Agent应用正从早期领域向更多元化方向渗透[12] 应用挑战与障碍 - 输出质量(准确性、相关性、一致性、遵循规范的能力)是阻碍Agent大规模应用的最大障碍,三分之一的受访者视其为主要瓶颈[14] - 延迟(20%)是第二大挑战,尤其在客服或代码生成等实时交互场景中,响应速度直接影响用户体验[17] - 对于员工超过2000人的企业,安全问题(24.9%)的关注度超过延迟,成为仅次于质量的第二大挑战[18] - 对于万人以上企业,“幻觉”和生成内容的一致性被提及为保障质量的最大挑战,同时在上下文工程及大规模管理上下文方面也困难重重[20] - 随着模型价格下降和技术优化,成本已不再是大家最头疼的问题,行业关注点正从“省钱”转向如何让Agent运行得更好、更快[17] 技术实施与评估 - Agent执行流程的可观测性已成为行业标配:89%的企业已为其Agent实施某种形式的可观察性,其中62%拥有详细的追踪能力[21][23] - 在已有Agent投入生产的受访者中,可观测性部署比例更高:94%部署了可观察性,其中71.5%具备完整的追踪能力[23] - 超过半数(52.4%)的企业会通过测试集进行离线评估,而在线评估的采用率较低(37.3%),但后者比例正在增长[25][26] - 当Agent进入生产环境后,“不进行任何评估”的团队比例从29.5%下降至22.8%,进行在线评估的比例则上升至44.8%[28] - 在评估方法上,行业呈现混合模式:近四分之一的团队同时采用离线和在线评估,普遍依赖人机结合方法,如采用LLM-as-judge(53.3%)和人工审查(59.8%)[31][33] - 传统机器学习指标(如ROUGE和BLEU)采用率较低,因其不适合评估开放式、存在多个合规答案的Agent交互场景[34] 模型使用与开发模式 - OpenAI的GPT模型在采用率上占主导,超过三分之二的企业正在使用[36] - 超过四分之三的团队在生产或开发中会使用多种模型,倾向于根据任务复杂度、成本和延迟灵活分配任务,而非绑定单一平台[36] - 超过三分之一的组织仍在投资部署开源模型,主要出于成本优化、数据主权或行业监管合规的考虑[38] - 微调尚未成为主流:57%的组织没有进行微调,而是更依赖于提示工程和RAG技术[38] 日常使用与工具类别 - 编程类Agent是日常工作中使用最频繁的类别,如Claude Code、Cursor、GitHub Copilot等工具被广泛用于代码生成、调试和测试[40] - 研究类Agent是第二大常用类别,由ChatGPT、Claude、Gemini、Perplexity等工具驱动,用于探索新领域、总结文档及整合跨源信息[41] - 基于LangChain和LangGraph构建的自定义Agent也广受欢迎,用于QA测试、知识库搜索、工作流自动化等内部场景[42] - 仍有相当一部分受访者表示,除了聊天或编程助手,还没用过其他类型的Agent,表明“一切皆可Agent”的愿景仍处于非常早期阶段[44]
硅谷顶尖风投 a16z 2026 大构想:从 AI 到现实世界的全面重塑
36氪· 2025-12-19 07:43
文章核心观点 a16z发布的《Big Ideas 2026》报告指出,科技发展正迎来关键转折点,AI将从“数字助理”进化为“自主执行集群”,并从屏幕中“溢出”以全面重构物理世界的运行规则,这将在多个领域催生颠覆性的投资机会[1][2][31] AI基础设施与智能体 - AI正从“对话工具”向“多智能体系统”跨越,2026年将见证这一转变,企业将由多智能体系统驱动,实现运营杠杆的历史性突破[1][2][7] - AI的终极目标是让用户离开屏幕,未来AI将在后台完成90%的重复性工作,投资逻辑将从关注用户粘性转向关注自动化任务的完成质量[8] - 企业中80%的知识锁在非结构化、多模态数据中,能高效清理、验证并管理这些“暗数据”的平台将掌握企业级知识管理的主动权,这是一个千亿级赛道[8] - 当智能体触发的递归任务流呈指数级增长时,现有基础设施将不堪重负,未来的“智能体原生基建”必须支持大规模并发、极低延迟和智能路由,这将决定AI应用落地的天花板[8][9] - AI将接管网络安全中大量重复性工作,解放安全团队进行更深层次的漏洞修复和犯罪追踪[10] - 创意工具将实现跨模态整合,用户可用一段声音生成视频或用草图生成3D建模,使内容创作的边际成本趋向于零[10] - 2026年将诞生第一所完全围绕AI构建的“AI原生大学”,其课程设置和科研协作由AI实时优化[10] SaaS与企业软件范式转移 - 企业软件正经历从“被动记录”到“主动推理”的范式转移,未来的企业软件将是“主动的智能工作流引擎”,能预测需求并协调端到端执行,取代仅提供存储功能的过时软件[1][11][13] - 在医疗、法律、建筑等垂直行业,AI将成为协调买卖双方、顾问与供应商的“超级节点”,打破行业围墙,大幅提升行业整体周转效率[14] - 个性化服务将实现从“为所有人优化”到“为每个人定制”的飞跃,AI将实时根据个人偏好量身定制教育路径、健康方案等独特体验[1][14] 物理世界的复兴与制造业 - 科技正在“溢出屏幕”,“比特”开始全面接管“原子”,软件和AI正在让美国制造业机器重新运转,迎来“电气化复兴”的黄金时代[1][2][15][21] - 未来企业将以“工厂思维”应对能源、采矿、建筑挑战,通过模块化部署和AI自动审批流程,使复杂流程像流水线一样高效,未来能像生产手机一样大规模生产核反应堆,像组装家具一样快速建造住房[21] - 电气化、材料科学与AI的进步正在融合,形成“电子工业堆栈”,使软件能够真正控制物理世界,从矿物精炼、电池储能到电力电子设备控制都由软件协调[22][23] - 掌握“电气化产业链”的国家和企业,将决定未来工业和军事技术的制高点[24] 生物健康与虚拟交互 - 2026年,AI将把“健康的青年用户”推向医疗科技的核心,通过长期、低成本的实时监测和预防性护理,帮助用户延缓进入重症阶段,这是一个极具潜力的长效订阅商业模式[25] - 在虚拟世界中,用户只需一段文字描述,AI就能实时生成完整的3D交互环境,这些“生成式多元宇宙”不仅用于娱乐,更是训练自动驾驶和机器人的重要虚拟靶场[26] 加密货币与金融基础设施 - 加密货币将化身为互联网的基础结算层,稳定币与RWA将重构金融底层[1] - 隐私将是未来区块链竞争的关键要素,具备隐私功能的区块链能够形成强大的网络效应,成为加密货币领域的赢家[27] - 越来越多的传统资产将被代币化上链,未来的代币化产品应充分利用加密技术的原生特性,例如永续期货等创新金融工具[28] - 稳定币正在成为全球支付的基础设施,2026年,新的支付方式将更加普及,稳定币将从一种金融工具转变为互联网的基础结算层[29] - 未来的即时通讯将采用去中心化协议,取代对私有服务器的依赖,从而实现更高的隐私和安全性[30] 投资格局与趋势总结 - AI的护城河正在下移,核心价值向“智能体协调能力”和“物理世界执行力”转移[31] - 制造业、电气化、能源基建等“硬科技”领域正在被AI重新赋能,将诞生新的万亿级巨头[32] - 能够为每个人提供定制化服务的平台,将拥有极高的获客壁垒和提价空间[33] - 投资者应抓住足以改变世界运行轨迹的“大构想”,重仓那些敢于重塑底层架构的颠覆者[33]
提升Agent的可信度后,企业会多一批好用的“数字员工”吗?
36氪· 2025-12-19 00:11
Agent技术架构的演进与核心差异 - Agent与Chatbot存在本质区别,Chatbot仅是交互界面,而Agent具备任务规划、执行、感知反馈和动态调整的完整能力,其技术复杂度和对生态的要求远高于传统对话系统[2] - 以行动为目的的AI核心在于关注结果,Agent模式实现了流程自动化,将原本由人维护的任务规划、工具调用和上下文管理能力内化,使Agent能在循环中持续工作数十分钟甚至数天[3] - Agent的兴起扩展了AI的可操作范围,未来传统软件界面可能消失,由Agent与系统直接交互[4] 当前Agent发展的关键瓶颈与优化方向 - 高性价比算力短缺是当前主要瓶颈,许多应用为控制成本而使用30B或7B等较小模型,并将上下文窗口限制在32K或更小,同时限制深度思考轮次[5] - 上下文数据质量至关重要,低信息密度和高噪声数据会严重影响输出结果,需要通过数据预处理和更频繁的上下文压缩技术来提升信息密度和可靠性[6] - 企业私有数据质量是决定Agent效果的关键因素,其预处理和构建的难度远大于模型选择或微调[6] - 随着处理链路变长,即使每个环节可用性达90%,经过十个环节后整体可用性也会下降到不可接受的水平[7] 多Agent协作与协议标准化趋势 - 未来必然是多Agent协作的世界,且交互关系将呈多对多、开放式,统一的Agent交互协议至关重要[8] - 行业普遍认为协议将走向开源统一,速度可能非常快,类似Kubernetes、gRPC等近代协议约两三年就进入中立治理阶段,MCP协议在发布约一年后已被捐赠给AIF[8] - MCP协议已获得各大厂商大力支持,并基本成为多Agent沟通的事实标准,其上层生态仍在不断创新,例如Anthropic的PDC协议可将多次MCP调用合并,使上下文长度缩短80%甚至更多[9] - 协议的价值在于让生态中各角色使用同一种语言沟通,使各方能专注于自身专业领域,无需耗费大量时间做适配工作[4][7] 企业落地Agent的成本与精度权衡 - Agent长程推理任务会导致上下文膨胀,显著增加显存、带宽消耗和成本,需通过上下文压缩、长期记忆持久化等“上下文工程”手段提升信息密度[10] - 可通过优化KV Cache,如利用CPU内存或SSD进行分层存储及不同层级量化来提升系统吞吐,但这会带来1%到10%的精度损失[11] - 成本与精度的权衡必须与业务深度结合,高容忍度业务可使用低成本、精度略低的模型,而容错度低的场景则必须使用高精度方案[11][12] - 在C端对话场景,若1秒内不能输出首token,用户体验基本失败,总体上需在1–2秒内给出首token并保持持续输出[31] 知识图谱与长期记忆的技术优势 - 知识图谱具备知识压缩、事实边界与操作约束等特性,是企业知识的高度浓缩,以结构化方式提供给大模型时,其约束和提示效果远强于冗长文本[12] - 相比RAG,知识图谱更能保证信息的完整与高度相关,查询实体时所有相关内容都能被提取,生成的上下文质量更高、长度更短、效率更高[13] - 知识图谱符合人类记忆模式,能支持Agent的长期记忆和自我进化,例如将成功运维经验写入图谱后,相同任务处理时间可从20分钟缩短到5分钟[14] - 从算力角度看,从知识图谱中精准取回高信息密度节点,比将整本书塞进context window要划算成百上千倍[15] 企业AI项目落地与价值评估维度 - AI价值主要体现在提效和赋能新事物两方面,当前AI在许多场景可达初级到中级人员能力水平[18] - 对于高频次、规则性强、容错率允许的工作,交给AI效率显著更高,AI在创意类任务中也表现突出[19] - 评估AI项目需关注:业务方能否明确AI的衡量标准、业务方是否掌握数据用于提示或微调、业务方是否有预算[20] - 能够实实在在为企业赋能的,是那些已被大规模使用的AI应用,如AI Coding,其效率提升和性价比是确定的[18] Agent业务对齐与调度策略 - Agent落地最难的不是协议对齐,而是业务对齐,相同的词在不同业务场景中有不同的语义,需与合作伙伴在业务理解上达成一致[20][21] - 大模型带来的挑战是技术人员需向前迈一步,不仅要掌握技术,还要理解业务需求和业务语言[23] - 在处理复杂流程时,调度逻辑可采用SOP写死、模型动态规划或两者混合的方式,取决于具体场景要求[25][27] - 在异构集群调度中,需根据不同类型节点的压测结果调整负载评估逻辑,并采用组合策略,根据workload的SLA要求进行分配,以兼顾性能与性价比[28][29] Agent可信性与安全熔断机制 - 目前提升Agent可信性主要依赖RAG和知识图谱,但幻觉问题无法100%解决,要求完全无幻觉的场景仍需依赖外围机制或校验流程[28] - 熔断机制包括:设置循环阈值、为API key设置rate limit和预算上限、通过沙盒机制实现执行环境隔离、监控Agent执行状态并在异常时外部kill[31][32] - 需对模型的任务规划和执行模型进行调整,确保符合可信标准,避免生成离谱操作,并在执行中加入安全检查[33] Agent未来形态与技术人员能力发展 - 长远看,传统软件形态可能消失,软件核心功能以API形式暴露给Agent,由Agent承担软件外壳作用[35] - 技术人员需理解Agent工作原理、调度和交互机制,但更核心的依然是对计算机整体运行机制和底层原理的理解[36][37] - 2026年,多Agent治理体系可能成为爆发的技术变量,生产级多Agent落地将大规模发生,但其运维、调试和监控的复杂性将呈指数增长[38] - 市场对Agent的认可度显著提高是关键,需要用户和企业找到适合自身业务的使用方式,发挥其长板、规避短板[40][41]
最权威AI Agent避坑指南来了,智能体越多死得越快,效率最高暴跌70%
36氪· 2025-12-14 23:14
核心观点 - 研究打破了“智能体越多越好”的误区,指出盲目增加智能体数量不仅增加成本,且对结果无益 [3] - 智能体系统的有效性取决于架构与任务属性的匹配度,而非智能体数量 [4] - 在许多场景下,一个强大的单智能体比多智能体团队更高效、更可靠 [36] 支配智能体性能的三大规律 - **工具越多,多智能体越容易“死机”**:当任务需要16种以上工具时,多智能体系统会出现明显“协调崩盘”,沟通成本会吞没核心推理能力 [6][7] - **能力越强,多智能体反而越没用**:当单智能体的准确率超过45%时,增加智能体数量通常会带来负收益 [8] - **架构决定错误放大效应**:独立多智能体模式下错误被放大17.2倍,而集中式多智能体模式有“经理”审核,错误仅被放大4.4倍 [11] 任务特征与多智能体协作效果 - **高度可分解的任务(协作“倍增器”)**:如金融推理,集中式协作架构带来高达+80.9%的性能提升,分散式和混合式架构也分别提升+74.5%和+73.2% [15] - **严格顺序依赖的任务(协作“累赘”)**:如游戏规划,所有多智能体架构性能下降-39%到-70%,其中独立型多智能体表现最差,暴跌70% [16][17] - **探索多、执行少的任务(协作“双刃剑”)**:如动态网页浏览,独立型架构表现糟糕(-35%),但分散式架构提升+9.2%;在业务工作流中,影响微乎其微(-1.2%到+5.7%) [21][22] 四种智能体架构的优劣 - **单智能体系统**:处理长链条、环环相扣的任务时最稳定且最省资源,无沟通成本与“协作税”,但面对庞大复杂任务时易被局部细节困住 [24] - **独立式多智能体**:执行速度快,无沟通延迟,但缺乏纠错机制,错误会直接进入最终答案 [25][26] - **中心化多智能体**:有协调者负责任务拆解、分发与审核,在结构化任务中更稳健,但协调者成为沟通瓶颈,增加协作开销 [27] - **分散多智能体**:智能体间可点对点沟通辩论,适合探索性强、信息模糊的任务,但通信量随智能体数量指数级增长,Token消耗巨大 [27][28] - **混合式架构**:试图融合中心化秩序与横向交流,理论上适配复杂任务,但结构复杂导致协作成本高,往往得不偿失 [29] 多智能体系统的经济性分析 - **Token利用率全面溃败**:单智能体每1000 Token能换来67.7次成功,中心化架构降至21.5次(效率为单智能体的1/3),混合式架构暴跌至13.6次(效率为单智能体的1/5) [30] - **对话轮次平方级膨胀**:智能体数量增加导致所需轮次接近平方级增长,单智能体平均需7.2个轮次,中心化多智能体需27.7个,混合式架构飙升至44.3个(是单智能体的6.2倍) [32][33] - **智能体数量存在上限**:3-4个智能体是当前技术下的“黄金分割点”,超过此规模通信成本将主导计算资源,导致边际收益为负 [35]
天润云(02167.HK)指出AI落地痛点:90%智能体“死”于缺乏运营
格隆汇· 2025-12-11 22:21
行业核心观点 - 企业AI智能化成效出现显著分化,差异根源在于是否构建了让智能体持续进化的运营体系,而非技术本身[1] - 智能体不是一次性交付的成品,而是持续进化的系统,其真正竞争力是“养出来的”,而非“买来的”[3] - 智能体时代的竞争,本质上是企业“运营能力”的竞争,比拼的是反馈飞轮速度、知识体系完整性和学习闭环严密性[9] 智能体与传统软件的根本区别 - 传统软件系统的能力由“开发完成度”决定,上线后价值基本成型,运营起辅助作用[3] - 智能体的能力不是在交付日确定的,而是在交付后由企业给予的反馈、知识、纠错和训练共同塑造[3] - 智能体基于“经验判断”而非“按规则执行”,因此会犯错和误解,其进化依赖于企业能否抓住并改正错误[6] 导致智能体成效分化的关键运营因素 - 模型提供通用智能而非企业智能,模型越趋同,企业间因运营体系差异导致的效果差距越明显[6] - 企业需建立“反馈→修正→学习→再执行”的闭环体系,将用户纠正、人工接管和新场景任务视为宝贵信号纳入持续训练[7] - 缺乏运营机制的企业,其智能体错误未被记录、知识未沉淀、反馈未被利用,导致在原地反复犯同样错误[9] 有效运营体系的特征与价值 - 判断企业智能体有无运营体系的三点标准:错误是否被记录、经验是否被沉淀、表现是否持续变好[6] - 运营是智能体产品的一部分,运营做得越深,智能体的智能上限越高[9] - 一个能持续进化的运营体系是企业未来智能化竞争的底层护城河[9] 企业组织与运营模式的转变 - 企业不再依赖“部署一次系统”来获取价值,而需依赖“持续让系统保持有效”[11] - 企业需主动将业务规则、行业经验和隐性知识结构化、标签化、编码化,并通过持续运营注入智能体[9] - 稳定、可扩展、能落地的AI能力,越来越取决于企业是否拥有成熟的运营体系,使智能体能适应业务、融入流程并持续优化[12] 行业服务提供商的价值主张 - 行业服务提供商不仅提供先进的智能体产品,更提供贯穿全生命周期的运营支撑,包括场景拆解、知识治理、运行监控和效果优化[12] - 其目标是帮助企业将AI转变为可靠的生产力,而非短暂的尝试[12] - 服务商存在的意义是让每一家企业都具备将AI“用好、养好、长期用出价值”的能力[13][14]
美国AI春晚,一盆凉水浇在Agent身上
36氪· 2025-12-11 10:00
文章核心观点 - AI Agent的时代已经到来,成为行业共识和确定性机会,但当前的基础设施(包括算力、成本、数据、软件生态)尚不完善,无法完全承接其爆发式发展,这既是挑战也孕育着新的商业和投资机遇 [5][9][14][15] Agent成为行业焦点 - 2025年12月,行业人士分赴NeurIPS会议与亚马逊云科技re:Invent展会,分别关注前沿AI研究与务实的AI落地机会 [4] - 在亚马逊云科技re:Invent展会上,与十多名美国开发者交流后形成的共识是:Agent的时代已经到来 [5] - 亚马逊云科技CEO Matt Garman宣布的12项AI新发布均围绕Agent的基建、开发和管理,并判断AI Agent正在让AI的价值真正释放 [5] - 相比2024年re:Invent展会只有不到五家厂商谈论Agent,2025年展会中宣称要做Agent的展商数量激增 [5][6] 基础设施面临严峻挑战 - 行业普遍认为当前Agent的基础设施还很薄弱,面临成本高昂和AI-first能力不足的问题 [9] - Agent发展的速度是破坏性的,厂商对Agent开发的需求呈指数级增加,对训练、推理算力及数据存储软硬件带来巨大挑战 [9] - 行业已逐渐从GPU短缺演变成了内存短缺 [9] - 在推理成本的巨大压力下,“为降低成本做开发”成为美国Agent创业圈新的竞争力评价体系 [11] - 市面上AI Agent的成本,平均百分之八九十都在推理上,AI应用公司需要将推理成本降低80%才能有真正的利润 [11] - 风险投资机构普遍会询问Agent初创公司推理成本以及订阅收入能否覆盖推理成本 [11] 软件生态尚未适配 - 当前的软件生态是为人类开发,而非为AI Agent开发,尚未做好被Agent调用的准备 [12] - 人类与AI对软件的使用偏好不同,AI讨厌需要浪费更多Token打通的“数据孤岛”,且在面对众多调用接口时容易因注意力分散而产生幻觉或智力下降 [13] - 厂商需要围绕“给Agent使用”的理念开展软件革命,包括:设计让Agent能简单表达需求的交互界面、避免制造数据孤岛、控制成本 [14] 基础设施领域的商业与投资机会 - 优化AI基础设施以降低模型调用过程中的推理成本,正成为基础设施创业的新风向 [15] - 2025年9月,英伟达被曝豪掷超9亿美元,拿下了AI基础设施初创公司Enfabrica的技术授权并雇佣了其CEO [15] - 数据作为Agent的另一项重要基建正受到重视,数据库厂商在展会中占据半壁江山,数据决定了Agent对业务和场景的理解 [15] - 数据库厂商面临的新命题是:寻找能与Agent更有效交互的数据库形态,以及进行扩容以承接爆发式的Agent开发需求 [15] - 有数据库展商表示近期正计划投资几个在美华人的AI基础设施项目 [15] - 若人人追逐最显性的Agent应用而无人做好匹配的基建,Agent可能成为泡沫 [17]
美国AI春晚,一盆凉水浇在Agent身上
36氪· 2025-12-11 05:35
行业共识:AI Agent时代到来 - 在2025年12月的亚马逊云科技re:Invent大会上,行业共识是Agent的时代已经到来[1] - 亚马逊云科技CEO宣布的12项AI新发布均围绕Agent的基建、开发和管理展开[1] - 与2024年大会仅有不到五家厂商谈及Agent相比,2025年展会中宣称要做Agent的展商数量激增[1][2] 当前挑战:基础设施与成本压力 - 行业普遍认为当前Agent的基础设施还很薄弱,面临成本高和AI-first能力不足的挑战[6] - Agent发展的破坏性速度导致对训练、推理算力及数据存储的需求指数级增加,行业已从GPU短缺演变为内存短缺[6] - 在推理成本的巨大压力下,Develop for Cost(为降低成本做开发)成为美国Agent创业圈新的竞争力评价体系[7] - 市面上AI Agent的成本平均80%-90%在推理上,AI应用公司需将推理成本降低80%才能获得真正利润[8] - 风险投资机构普遍关注Agent初创公司的推理成本以及订阅收入能否覆盖推理成本[9] 生态瓶颈:软件与数据适配 - 当前软件生态是为人类而非AI Agent开发,软件尚未做好被Agent调用的准备[10] - AI Agent在使用为人设计的软件时面临挑战,例如需要消耗更多Token打通数据孤岛,以及因接口众多导致注意力分散、产生幻觉或智力下降[11][12] - 行业需要进行一场以“给Agent使用”为核心的软件革命,包括设计适合AI的交互语言、消除数据孤岛以及控制成本[13] 投资机遇:基础设施迭代与优化 - 为Agent“泼冷水”也意味着模型层、Infra层和数据层厂商存在大量的迭代优化空间和商业机会[14] - 通过优化AI基础设施以降低模型推理成本,正在成为新的创业和投资风向[15] - 例如,英伟达在2025年9月以超过9亿美元的价格获得了AI Infra初创公司Enfabrica的技术授权并雇佣了其CEO[15] - 数据作为Agent的另一项关键基建正受到重视,数据库厂商的新命题是寻找与Agent更有效交互的数据库形态并做好容量准备以承接爆发的开发需求[15][16] - 行业观点认为,若人人追逐显性应用而无人建设匹配的基础设施,Agent领域将可能形成泡沫[18]
联想创投宋春雨的“Agent”投资全复盘:8大平台级机会、4个创业者特征、和给Agent 创业者的3个建议
搜狐财经· 2025-12-10 09:31
联想创投对智能体(Agent)的投资战略与核心观点 - 公司自2024年4月18日起将Agent定义为核心投资方向之一,在随后的600天内已投资Youmind、Aha Lab、Liblib AI等10余个Agent项目[2] - 公司认为,如果说AGI的前一波浪潮是大模型和算力,那么当前这一波的核心则是智能体(Agent)[2] - 公司坚定投资Agent的核心逻辑在于,大模型和算力很少直接接触最终客户,商业价值有限,而Agent是真正能够承载商业价值的载体[3] - 公司的核心判断及与其他机构的差异化在于,更看重拥有平台型机会的智能体[4] 八大平台型投资机会 - **机会一:内容领域**:AIGC的生成能力将重塑多模态内容生成,带来颠覆式创新,例如投资的Liblib AI,旨在通过自然语言交互降低创作门槛,目标是成为AI时代的Photoshop和Canva[4] - **机会二:AIOS(AI操作系统)**:坚信AI时代将出现覆盖所有终端的原生AI操作系统,其交互方式将超越现有的Windows/安卓/iOS和触摸操作,投资了光帆科技和阶跃星辰等在此方向努力的公司[5] - **机会三:Coding(代码生成)**:认为代码平台是与算力平台并列的数字世界基石,该赛道不会收敛于Cursor等少数公司,即使Cursor估值近300亿美元,但仍有巨大空间,公司投资了专注于用Agent将自然语言直接生成完整代码的企业[5][6] - **机会四:模型即应用**:看好基础模型本身即应用(Model as an Agent)的模式,以投资的智谱、Mistral AI为例,并寻找中国版的Palantir(其商业模式是将模型直接交付企业客户,过去一年股价增长5倍)[6] - **机会五:重塑双边关系**:认为用AI重塑生产关系(而不仅是生产力)将体现更大商业价值,例如投资的Aha Lab,在MarTech领域用AI重构品牌与KOC间的全流程协作,打造双边效率平台,其连续8周的数据和收入保持高增长[7] - **机会六:AI加硬件**:认为AI时代原生的新硬件作为新终端和AIOS载体,必将出现新的平台型机会,这也是联想自身的发展方向[7] - **机会七:AI时代的原生应用**:关注智能体如何重塑如社交等原生应用,探索真人、机器人共存的社交平台新形态[7] - **机会八:Agent基础设施**:关注围绕Agent的新基础设施体系,而非传统的算力基础设施[8] 最看好的Agent创业者四大特征 - **特征一:年轻人**:赛道需要创新和原创,优秀创始人中非常大比例是90后,强调开放与闯劲的心态[9] - **特征二:领域深度经验**:无论是ToC还是ToB,都看重创业者在所在领域的深度knowhow,例如Liblib AI创始人在视频工具领域的经验,或浙江中控创始人在工业OS领域的积淀,这是满足用户真实诉求和快速获客的关键[9] - **特征三:原创能力**:即从0到1的颠覆性创新能力[10] - **特征四:折腾能力**:许多Agent创业者并非在第一个方向就成功,而是在快速迭代和转变中使思路变得清晰,这种能力常与年轻特质捆绑[10] 给AI创业者的三项建议 - **建议一:领先模型代际**:Agent若想胜出,必须领先代际模型至少半年时间,以超过模型现有能力的标准打造智能体,从而起到引领作用,例如Cursor定义了AI Coding范式,使得Claude基于此领域的优势,年度营收接近60亿美元,而OpenAI的年度营收预测为200亿美元[11][12] - **建议二:敢于直面大厂竞争**:AI原生的平台型机会值得创始人投身与大厂竞争,AI Native的创新有机会在全球定义新品类,从而获取免费流量和用户关注,例如Liblib AI吸引了大量职业独立设计师这一活跃用户群体,中国公司在定义新品类上具有优势,且大厂的创新效率往往不及创业公司[13] - **建议三:从第一天瞄准全球市场**:优秀的AI Agent创业者从Day 1就瞄准全球市场,原因包括:AI原生创新是全球性机会、中国已培养出具备全球竞争力的软件工程师人才、有中国大厂背景的创业者天生适合做全球C端产品,美国AI创业以SaaS的AI化为主,单个机会小但数量多,而中国此波创业者(如Liblib AI、ONE2X、YouMind的创始人)多瞄准天花板更高的ToC机会[15][16] 联想生态的协同优势 - Agent的发展符合联想“混合式人工智能”策略,且当前AI生产力的构建多基于PC场景,联想的架构对Agent公司是重要的生态补充[14] - 联想是全球PC市场份额第一、唯一能实现全球出货的中国设备厂商,其摩托罗拉手机在美、欧、日市场位居前三,对于从第一天就瞄准全球市场的Agent而言,联想生态将是非常有益的助力[14]