Workflow
A2A
icon
搜索文档
Agent 正在终结云计算“流水线”,Infra 必须学会“思考” | 专访无问芯穹夏立雪
AI前线· 2025-12-02 04:28
基础设施范式转变 - 基础设施演进正从AI Infra走向Agent Infra乃至Agentic Infra,成为推动智能体规模化落地的关键力量[2] - 范式从“处理”转变为“思考”,基础设施需从“生产线工厂”转变为“解决方案公司”,为Agent的整体产出质量提供系统性支撑[3] - 基础设施需具备智能性,能够保障Agent执行任务的质量,协调连续且相互关联的多任务协作[3][4] Agent Infra 核心升级维度 - 运行环境需灵活适配Agent的执行方式,环境的沙盒化与灵活调度能力尤为关键[4] - 为Agent配备完善的工具,使其能够有效调用资源[4] - 提供精准而充分的上下文信息,确保任务理解与执行的一致性[4] - 通过安全与监控机制,保障整个任务过程的可控性与可观测性[4] Agentic Infra 的演进与目标 - Agent Infra是第一阶段,旨在让算法能力被更好地发挥,推动智能体走出实验室环境,帮助Agent从演示品走向生产力[9] - Agentic Infra是第二阶段,重点构建能更好支持下一代AI进化与规模化落地的基础设施,推动智能体深度参与基础设施的核心工作流[10] - 目标是实现从“将智能体视为工具”到“将智能体视为协作者”的范式转变,构建支撑智能体高效、稳定、低成本协作与进化的基础设施新形态[10] 当前Agent发展的核心问题与瓶颈 - 模型能力已经相当出色,但配套给Agent的基础设施服务与工具尚不成熟,瓶颈不在模型本身,而在支撑体系的响应能力[5][6] - 用户对“无代码编程”的期待是“用自然语言一步到位生成完整程序”,但现实仍需频繁迭代和更专业知识,高门槛和不确定性导致用户流失[5] - Lovable平台的用户数从6月的峰值3512万跌至9月的不足2000万,下降了超过40%[5] 算力资源优化与调度创新 - 传统AI算力基础设施以固定虚拟化或容器化单元划分资源,在Agent场景下极不经济,造成资源浪费[15] - 良好Agent Infra通过微虚拟化沙箱、沙箱调度和高并发沙箱管理机制,实现毫秒级环境切换和接近100%的资源利用[16] - 容器冷启动过程通常耗时数秒到数十秒,在高频创建和销毁任务的Agent场景中会造成大量时间损耗与资源空转[15] 异构算力统一调度与生态整合 - 核心技术创新是实现资源的统一标准化,包括功能层面打通不同类型算力的使用和效率层面实现任务的合理分配[16] - 国内算力资源种类多样、分布分散,基础设施必须始终面向最前沿,让Agent像使用水电一样使用算力[7][17] - 技术适配是早期最大阻力,一旦把不同模型与不同硬件之间的M × N映射打通,后续维护成本不高[17] 技术先进性与工程落地的协同 - 构建AI原生的基础设施,技术先进性与应用落地性相辅相成、互相迭代[19] - 研发支持弹性伸缩和动态资源调度的沙箱系统,每个Agent的沙箱可以按需启动或销毁,实现毫秒级响应[20] - 资源分配可根据任务类型和负载自动调整,通过智能调度引擎实现高峰弹性扩容、低峰快速收回,显著提升集群资源利用率[20] 未来基础设施形态与发展愿景 - 未来希望看到智能体之间进一步形成组织,共同完成更复杂的任务,各个智能体的KV Cache和上下文可以根据需求实现共享或隔离[14] - 目标是释放无穹算力,让AGI触手可及,通过系统层面的创新,让AGI能够更高效、更可持续地实现[22] - 基础设施引入Agent能力后具备自主性,从而实现更高效的资源整合和更具价值的功能创新[13]
人工智能行业专题(12):AIAgent开发平台、模型、应用现状与发展趋势
国信证券· 2025-09-10 15:25
投资评级 - 行业投资评级为优于大市(维持)[1] 核心观点 - AI Agent是突破指令执行的智能实体 具备代理权 可主动感知 自主决策并执行复杂任务 在AGI分级中处于L3智能体阶段 性能等效90%熟练成年人[3] - AI背景下AI基础设施层面临重构 客户将重新选择云/AI平台 云厂商加大布局AI/Agent平台瓜分新市场[3] - 海外模型呈现差异化发展 国内模型层并未拉开显著差异 2025年初深度推理与长上下文模型发布推动Tokens调用量快速提升[3] - 应用C端重磅搜索产品依赖模型能力与生态导流 图像与编程类产品发展迅猛 应用越偏向垂类则技术门槛越低 产品理解要求越高 竞争越激烈 商业化闭环越容易[3] - 应用B端Copilot/Agent产品形态丰富 持续渗透 机遇与挑战并存 企业落地仍面临幻觉 数据安全 成本高等问题[3] - 全球AI IT支出2023-2028年CAGR 22.3% 其中GenAI达73.5% CBINSIGHTS预计2032年AI Agent营收有望达1036亿美元(CAGR 44.9%)[3] Agent定义、技术与发展 - AI Agent具备自主性 规划力与执行力 核心突破在于赋予代理权 可主动感知环境 自主规划决策 执行复杂任务[10] - 关键特性包括自主决策 动态学习 跨系统协作 核心模块包括感知层 记忆层 决策层 执行层[10] - 与LLM和传统自动化的关键区别在于LLM是知识顾问 Agent是战略指挥官 传统自动化仅规则执行 Agent实现端到端任务闭环[10] - 在AGI分级中 Agent处于L3智能体阶段 性能等效90%熟练成年人[11] - 代理核心构成包括记忆 感知 规划 工具使用[12][15] - 相关技术创新包括MCP(模型上下文协议)和A2A(Agent-to-Agent通信协议)[16][19] - Agent市场图谱分为基础设施类 横向职能类 垂直应用类三大类别[20][22] Agent开发平台的布局 - 海外云厂商平台布局对比:微软聚焦B端基础设施 模型支持最全面 工具链和生态整合全面 安全与稳定性强 谷歌兼顾B/C端多场景 多模态强但生态不成熟 市占率较低 亚马逊依托AWS服务中小企业 侧重算力销售与便捷部署但工具链分散[51] - 国内平台布局对比:字节扣子覆盖全场景 开发者与智能体数量领先 阿里百炼主攻B端全行业 服务30余万企业客户 MCP工具链和开源生态丰富 腾讯元器基于混元大模型 主打轻量化低代码开发 聚焦社交与游戏垂类[55] - 微软Azure AI Foundry已被80%财富500强企业使用 25Q2处理tokens超500万亿 同比增长超7倍 agent service客户数达1.4万[42] - 谷歌AI平台架构涵盖数据综合层 控制层 数据层 业务活动层 赋能基础设施包括TPU v7 Ironwood和英伟达支持[48][49] - PaaS/Agent平台面临市场份额重构机会 IDC调查显示70%受访企业将更换或新增云/AI平台供应商[56] - 平台关键需求包括提高开发交付效率 AI驱动的工作流自动化是首要需求 安全与隐私是最大落地障碍[62][63] - 企业AI战略重心分层 核心模型能力是第一抓手 云服务商在助力实现AI目标的供应商中占比49%[68][70] 模型层与Tokens调用量分析 - 根据Openrouter数据 谷歌Gemini与Anthropic Claude占API市场半壁江山 国内DeepSeek 阿里Qwen系列份额稳步提升[3][95] - 谷歌2025年7月调用量980万亿tokens 较去年增长100倍 其中内部需求占比高达97%[3] - 国内字节豆包2025年5月日均tokens 16.4万亿 增长137倍 内部占比超80%[3] - 海外模型差异化发展:OpenAI技术路径领先 聚焦推理与专业能力 谷歌端到端原生多模态领先 Anthropic编程场景领先 实用性突出[102][103] - 国内模型未拉开显著差距:DeepSeek技术研究领先 阿里自研能力与综合能力强 字节各模态均衡 百度中文场景优化 腾讯基于DeepSeek改造[105][106] - 分场景份额:编程场景Claude Sonnet4占近半调用量 角色扮演场景DeepSeekV3领先 科技金融场景Claude Sonnet4与Gemini Flash占优 营销搜索翻译场景Gemini Flash优势明显[108][111][113] - 过去半年模型周tokens消耗量增长4.7倍 深度推理与长上下文模型发布推动调用量快速提升[122][123] C端与B端Agent进展 - 应用C端重磅搜索产品依赖模型能力与生态导流 ChatGPT MAU预计年底超10亿 Gemini MAU 4.5亿 国内夸克 元宝依托生态导流[3] - 图像类Midjourney ARR 5亿美元 可灵月收入1.5亿元 编程类Cursor ARR 5亿美元 GitHub Copilot Web MAU 1.2亿[3] - 应用B端Copilot/Agent产品形态丰富 持续渗透 微软Copilot家族月活用户已超1亿 但企业落地面临幻觉 数据安全 成本高(Agent调用成本为LLM 15倍)等问题[3] - 根据CBINSIGHTS 企业工作流 编码两大领域2024年营收均超10亿美元 微软Microsoft Copilot 2024年收入约8亿美元 GitHub Copilot收入约6亿美元 总占整体市场超25%份额[25] - 垂类市场中客户服务 软件开发为高潜力赛道 64家组织中2/3计划12个月内用AI代理支持客服[25] Agent的市场空间与发展预期 - 根据IDC数据 全球AI IT支出2023-2028年CAGR 22.3% 其中GenAI达73.5%[3] - CBINSIGHTS预计2032年AI Agent营收有望达1036亿美元 CAGR 44.9%[3] - 根据Garnter与IDC 短期(2023-2025)GenAI嵌入现有应用 中期(2025-2027)Agent成核心组件 长期(2027+)自主代理网络主导业务 2035年后Agent将成为认知共生的人类助手 智能体即应用将成主流[3]
AI智能体,是不是可以慢一点? | ToB产业观察
钛媒体APP· 2025-05-06 05:42
大模型应用套壳争议 - Manus采用第三方大模型进行工程化包装实现通用AI智能体能力 被业内质疑为"极致套壳" 但创始团队认为这是成功策略 [2] - 行业普遍以自研基础大模型为荣 DeepSeek OpenAI等头部企业聚焦底层技术研发 形成赢者通吃格局 [2] - 金沙江创投朱啸虎直言"所有AI应用都是套壳应用 所谓壁垒是忽悠人的" 反映行业对应用层技术价值的争议 [2] 市场融资与估值动态 - Manus背后公司"蝴蝶效应"获Benchmark领投7500万美元融资 估值飙升至5亿美元 [2] - 融资事件显示资本市场对AI智能体赛道的认可 尽管存在技术争议 [2] 大厂AI智能体布局 - 字节组建至少5个团队开发不同AI智能体产品 推出"扣子空间"协作平台 提供股票分析和行研分析两类专业Agent [4] - 百度95后团队30天研发对标Manus的"心响"APP 涵盖超200个任务类型 包括专业咨询和日常规划 [4] - 阿里与Manus战略合作 基于通义千问开源模型实现功能复制 并推出"心流"智能体开启公测 [5] 技术生态构建 - 阿里云 腾讯云 蚂蚁集团 百度等大厂相继拥抱MCP机制 推动智能体间通信和资源连接 [6] - 民生证券预测MCP协议+Agentic-based决策路径将成为主流范式 大厂通过协议引入生态伙伴推动产业发展 [6] 安全风险与治理挑战 - AI智能体自主决策特性带来更高安全风险 包括幻觉问题 提示注入攻击 数据泄露等隐患 [7] - 多智能体协作导致访问控制漏洞 资源竞争冲突等问题 安全管理复杂度指数级上升 [8] - 70%以上企业客户对AI智能体认知不足 行业缺乏专职安全团队 产品安全性能存疑 [7][8] 技术本质与发展趋势 - AI智能体需解决感知 理解 规划 执行等多环节协同 技术架构复杂度远超传统系统 [11] - 微软预测未来将出现专业智能体集群 通过通信协作完成任务 Anthropic和谷歌分别推出MCP A2A协议提升搭建效率 [10] - 行业需从被动执行转向主动进化 如自动驾驶系统对传统技术模块的AI化改造 [11]
Agent 开发的上半场: 环境、Tools 和 Context 如何决定 Agent | 42章经
42章经· 2025-04-27 14:10
Agent定义与核心特征 - Agent是基于环境反馈使用工具的程序 采用Anthropic的定义[2] - 核心三要素包括状态(Context)、行动(Tool Use)、激励信号(RL反馈机制)[32][33] - 与RL强关联 需理解强化学习才能设计优质Agent产品[31] Agent技术演进 - 2023年4月AutoGPT为代表的早期Agent更像玩具 实际应用价值有限[4] - 当前Agent已能在工作生活场景中真正解决问题 实现价值跃迁[5] - 进步源于:1)底层模型能力提升(如RL结合、长思维) 2)工程产品突破(Context构建)[6][7] Context工程创新 - Context是大模型执行任务所需信息总和 不同产品Context构成不同[8] - 相比传统RAG Agent能自动化提炼Context 减少人工干预[10][11] - 优质Context需包含用户历史行为路径 如APP打开瞬间即提供海量意图线索[48][49] Tool Use技术方案 - Function Call/MCP/A2A属于代码驱动派 Computer Use/Browser Use属于视觉模拟派[13] - MCP核心价值在于统一Tool Use标准 降低工具调用门槛[12] - Browser Use存在纯视觉方案(如已倒闭的Adept)和API包装方案 后者更成熟稳定[15] 产品设计方法论 - Chat是最佳交互入口 保障用户自由度优于追求准确度[41] - 需解决双重信任问题:开发者信任模型能力 用户信任执行过程[52][54] - 垂直领域Agent将长期主导 通用Agent面临收敛困难[25][46] 行业竞争格局 - 当前Agent可分为:1)Coding Agent(交付代码) 2)调研Agent(交付报告) 3)表格Agent(定量分析)[61][64] - Sheet0实现100%准确率 核心在于模块化工具复用与AI Coding验证[57][67] - AI Coding与Agent存在协同效应 但直接编码执行任务成本过高[29][30] 发展关键变量 - 模型能力突破与Context工程进步是两大核心驱动因素[69][70] - 需构建完整评估体系(激励信号) 确保系统可收敛[35][71] - 产品需平衡通用性与准确性 不同场景选择不同技术路径[59][60]