Agent

搜索文档
2025上半年AI核心成果及趋势报告 量子位智库 2025-7_01
搜狐财经· 2025-08-04 08:16
应用趋势 - 通用类Agent深度整合工具使用,完成场景多样的深度研究类任务,交付内容更加丰富,成为2025上半年应用亮点 [1][9] - 以视觉操作为核心的Computer Use Agent (CUA)开始推向市场,代表通用类Agent的另一条路径,正在与基于文本的深度研究类Agent融合 [1][9] - 垂类应用场景开始Agent化,自然语言操控功能正在成为垂类工作流的一部分,覆盖旅行、设计、创作、时尚等领域 [11][12] - AI编程成为当前最核心的垂类应用领域,正在从源头改变软件生产方式,头部编程应用收入增长速度创纪录,获得市场有效验证 [13][14] - 模型上下文协议MCP加速大模型应用普及,赋能模型获取大量外部信息、操控现有软件应用,打开更大应用空间,但尚未达到规模化生产级水平 [1][15][16] 模型趋势 - 模型推理能力在思维链范式下持续提升,数理类、代码类问题提升尤其显著,AIME 25准确率提升7%,GPQA Diamond准确率提升23%,Codeforce代码竞赛排名提升43% [18] - 模型开始走向Agentic,对工具使用进行端到端训练集成,工具使用能力相比原本的思维链推理有重大提升,可完成更复杂困难的任务 [1][19][20] - 大模型开始端到端融合视觉和文本走向多模态推理,以语言为中枢逐步解锁多模态推理的系统2慢思考 [22][23] - 模型图像生成能力全方位增强,语言理解能力升级和审美提升,普通用户可以仅通过自然语言进行完整创作 [24] - 视频生成模型整合原生配音,可控性和编辑灵活度增加,生成视频的物体一致性和物理规律协调性增强,AI视频商业化和普及度进展积极 [26] - 模型智能密度持续提升,模型厂商积极推出小模型实现极致性价比,降低模型部署硬性门槛,加速模型应用普及 [26] - 模型评估加速演化,传统评估榜单快速饱和,可以动态更新,能在真实世界产生使用价值任务成为重要评估方向 [27] 技术趋势 - 训练资源向后训练和强化学习倾斜,预训练仍然有充足的优化空间,二者最终共同决定模型能力 [29] - 强化学习的重要性继续提升,算力消耗在未来会超过以自监督学习为核心的预训练,未来会从数学、代码等奖励清晰的领域向其他领域泛化 [28][30] - 多智能体系统可能成为继思维链推理模型之后的下一个前沿范式,继续提高智能上限 [31][32] - 在线学习有希望成为下一代模型学习方式,正在成为核心突破,可使模型摆脱对人类数据的依赖,提高智能上限 [33][34] - Transformer模型架构正在快速迭代,优化主要集中在注意力机制和前馈神经网络等层面,在工业界有多个落地案例 [35] - Transformer混合架构正在涌现,以RNN变体为主,已经出现在工业界大规模应用 [35] - 由于生成和验证难度的不对称性,代码验证成为目前AI编程自动化水平提升的前沿方向,可进一步加速软件生产自动化 [36][37] - 系统提示词正在成为决定模型用户体验的关键技术要素,相比更新大模型更加轻量化、敏捷化 [38][40] 行业趋势 - xAI发布Grok 4在多个领域达到SOTA水平,跻身全球大模型第一梯队,改变模型层竞争格局 [43][44] - 算力是AI竞赛中的关键竞争要素,强化学习对算力的需求超过预训练,头部大模型玩家的计算集群已达到数十万卡规模,并在持续扩张中 [47][48] - OpenAI技术领先优势明显弱化,海外头部玩家水平趋同,xAI上半年迎头赶上,模型在多个领域达到SOTA水准 [49] - 中美通用大模型技术差距缩小,中国模型公司在通用大模型之外的多模态领域达到SOTA水平,尤其多模态领域表现出色 [51] - AI编程领域成为模型厂商必争之地,海外和国内头部玩家在AI编程的模型和产品领域密集布局 [52][53] - 国内大模型创业公司路线开始分化,部分厂商积极发布前沿模型产品追求智能上限,其他厂商专注垂类领域和商业化落地,放缓通用模型投入 [54]
智能体大战分水岭时刻:四种技术路径全解析
36氪· 2025-08-04 07:16
通用AI代理技术架构分析 - OpenAI发布通用型ChatGPT Agent 整合深度研究工具Deep Research与执行工具Operator 实现一站式复杂任务处理 但存在速度慢和个性化不足等短板[1] - 主流Agent底层架构分为四种类型:基于浏览器的Agent、浏览器加沙盒的Agent、限制型沙盒Agent以及工作流集成Agent 不同架构在通用性和效率间存在权衡[11] - 浏览器架构具备万能特性但运行速度慢且Token消耗高 沙盒架构可高效执行本地脚本但无法联网操作 工作流集成架构结果精准但业务范围有限[12] 主要厂商产品特性对比 - ChatGPT Agent在浏览器执行层面表现优异 在Browsing Camp基准测试中达到50%以上分数 远超其他20多分的开源方案[6] - Manus采用虚拟机加浏览器架构 理论覆盖范围广但受浏览器能力限制 执行任务需要30多分钟[18] - Genspark采用模板化垂直Agent方案 通过限制工具数量提升速度 但通用性受限[23] - Pokee通过第三方SDK集成实现速度优势 比市面产品快4-10倍 但仅支持创作者或企业账户[24][27] 商业模式与技术路线选择 - B端产品聚焦专业人士重复性工作场景 C端产品更适合浏览器导向的标准化需求[31] - 美国科技公司API开放程度较高 国内生态正在逐步开放 高德地图在MCP协议推动下已开放地图生态[33][34] - Agent将改变流量分发模式 传统门户网站流量可能下降 Agent入口价值凸显[37] - 协议竞争成为关键 谷歌推出A2A协议 OpenAI和Pokee等厂商也自主推出协议以占据入口地位[40] 行业生态变革影响 - Agent可能重塑广告行业形态 从流量分成转向知识产权付费模式 创作者可通过Agent调用直接获得收益[43][44] - 推荐系统算法面临根本性变革 从排名展示转向连续交互机制 每条推荐需确保精确性以维持交互时长[46][47] - 传统基于排名的推荐系统发展潜力可能被压缩 交互机制更注重体验和探索[49]
AI产业速递:亚马逊FY25Q2经营稳健增长,继续加强AI基建
长江证券· 2025-08-04 02:15
行业投资评级 - 投资评级:看好丨维持 [8] 核心观点 - 亚马逊FY25Q2营收1677.02亿美元,YoY+13%,环比+8%,超彭博预期1621.46亿美元;净利润181.64亿美元,YoY+35%,环比+6%,超彭博预期142.71亿美元 [2][5] - Q2资本开支322亿美元(不含融资租赁口径),超彭博预期260亿美元,主要用于AWS相关投资 [2][5] - 预计FY25Q3营收1740~1795亿美元,YoY+10%~13%,中位数1767.5亿美元,超彭博预期1732.4亿美元 [10] - AI需求旺盛,AWS云业务年增长率达三位数,价值体量数十亿美元 [10] 业务拆分 - 北美地区营收1001亿美元,YoY+11%;国际地区368亿美元,YoY+16% [10] - 在线商店营收614.85亿美元,YoY+11%,超预期591.29亿美元;第三方卖家服务403.48亿美元,YoY+11%,超预期389.72亿美元 [10] - 广告服务156.94亿美元,YoY+23%,超预期149.89亿美元;订阅服务122.08亿美元,YoY+12%,超预期119.22亿美元 [10] - AWS云业务308.73亿美元,YoY+17%,与预期307.65亿美元基本持平;营业利润率32.9%,环比下降 [10] 资本开支与未来指引 - Q2资本开支322亿美元,主要用于AWS技术基础设施及Tranium等定制芯片投资 [10] - 预计FY25Q3营业利润155~205亿美元,中位数180亿美元,略低于彭博预期194.2亿美元 [10] 业务进展与经营展望 - 购物Agent Alexa Plus已有数百万客户使用;推出Deepfleet AI模型,提升10%行驶效率 [10] - 发布Strands简化AI Agent构建,推出Agent Core提供扩展功能 [10] - 生成式AI与业务融合成效显著,战略聚焦AI基础设施与场景化落地 [10] 投资建议 - 重点关注AI基础设施、出海应用(视频/Coding/解决方案)、场景化落地(教育/税务/医疗) [2][10]
2025上半年AI核心成果及趋势报告
搜狐财经· 2025-08-03 00:04
应用趋势 - 通用类Agent产品深度整合工具使用,主打完成场景多样的深度研究类任务,交付内容更加丰富,成为2025上半年应用亮点 [1][11] - 以视觉操作为核心的Computer Use Agent (CUA)开始推向市场,正与基于文本的深度研究类Agent融合 [1][11][14] - 垂直应用场景开始Agent化,自然语言操控功能成为垂类工作流的一部分 [1][16] - AI编程成为当前最核心的垂类应用领域,头部编程应用收入增长速度创纪录,Cursor ARR突破5亿美金 [1][17] - 模型上下文协议MCP加速大模型应用普及,赋能模型获取大量外部信息、操控现有软件应用 [1][19] 模型趋势 - 模型推理能力在思维链范式下通过堆积更多算力持续提升,数理类、代码类问题提升尤其显著,AIME 25竞赛准确率提升7%,Codeforce代码竞赛排名提升239位 [1][22] - 大模型开始走向Agentic,对工具使用进行端到端训练集成,可完成更复杂困难的任务,Humanity's Last Exam榜单表现提升81% [1][23][24] - 大模型开始端到端融合视觉和文本走向多模态推理,以语言为中枢解锁多模态推理 [1][26] - 大模型图像生成能力全方位增强,语言理解能力升级和审美提升是最大亮点,可生成高拟真度的照片和自拍、吉卜力风格图片 [1][28] - 视频生成模型整合原生配音,可控性和编辑灵活度增加,生成视频的物理规律协调性增强,字节Seeddance 1.0模型在视频生成功能中排名第一 [1][29] 技术趋势 - 训练阶段资源投入向后训练和强化学习倾斜,预训练仍有充足优化空间,强化学习算力消耗未来会超过预训练 [2][9] - 多智能体 (Multi-Agent) 系统可能成为下一个前沿范式 [2][9] - 从交互经验中学习有望成为下一代模型学习方式 [2] - Transformer模型架构快速迭代,混合架构涌现 [2] 行业趋势 - xAI发布Grok 4跻身全球大模型第一梯队,证明大模型无护城河 [2][9] - 算力是AI竞赛关键要素,头部玩家计算集群达数十万卡规模 [2] - OpenAI领先优势缩小,谷歌和xAI迎头赶上 [2][9] - 中美通用大模型技术差距缩小,中国模型在多模态等领域表现出色 [2] - AI编程成为必争之地,海内外头部玩家密集布局 [2][17] - 国内大模型创业公司路线分化 [2]
大模型降温?AI小虎讲新故事:抢做能用好用的Agent
南方都市报· 2025-08-01 14:28
Manus新功能发布 - Manus发布新功能Wide Research 目前仅对Pro用户开放 未来将向Basic和Plus用户开放 [1] - Manus近期经历裁员风波 与阿里在中国的合作搁置 [1] - Peak季逸超上次为产品录制视频是在今年3月Manus引发Agent热潮时 [1] WAIC展会动态 - 今年WAIC吸引800余家企业参展 40余款大模型亮相 2024年参展模型数量达近百款 [2] - "AI大模型六小虎"中的百川智能与零一万物缺席今年展会 [2] - 阶跃星辰发布新一代基础大模型Step 3 与吉利合作推出AI智能座舱银河M9 实现端到端语音大模型量产上车 [3] - 阶跃星辰已覆盖国内超一半头部国产手机厂商 深度合作打造手机Agent体验 [3] 大模型厂商新动向 - 月之暗面发布并开源万亿参数Kimi K2大模型 强调通用Agent任务能力 [5] - 智谱发布GLM-4.5和GLM-4.5-Air模型 在12个基准测试中显示其国内排名第一 [5] - Minimax发布行业最高难度运动场景视频生成模型Hailuo 02和MiniMax Agent等产品 [5] - 商汤科技林达华表示Agent依赖大模型的推理、反思、规划、决策能力 是技术落地重要载体 [5][6] Agent应用趋势 - Agent从通用走向垂类场景 行业更关注能否创造实际价值 [7] - 腾讯展示12个垂直智能体应用 覆盖企业服务、生活服务与办公效率场景 [8] - 腾讯共富AI智能体针对微信生态"土特产"小店与农文旅营销场景 [8] - 金山办公WPS AI 3.0搭载Agent能力 专攻办公场景 可实现PPT一键生成和自主排版 [8] 企业级Agent部署 - 极光集团推出Multi-Agent平台 内置多种AI Agent角色 90%业务布局海外 [10] - 极光采取端到端项目制交付方式 强调私有化部署重要性 [10] - 恒生活数科依托"恒纪元"大模型打造六大金融智能应用矩阵 加速金融服务转型升级 [11] - Agent在C端商业化可能性被探讨 翻译等场景可能成为突破口 [11]
透过史上最火WAIC,看Agent六大趋势
36氪· 2025-08-01 09:55
行业核心观点 - Agent从概念验证阶段进入大规模应用阶段 成为人工智能行业的必答题 [1] - WAIC 2025展示800余家企业3000余项展品 展品数量比往年增加一倍 [1] 技术发展趋势 - 万物皆可Agent化 从工业生产到医疗健康等多领域实现应用落地 [2][4] - 智能体系统展示工业场景协同能力 西门子Industrial Copilot实现从订单输入到物流调度的全流程自动化 [2][4] - 多智能体协同(Multi-Agent)成为解决复杂任务的关键方式 蜜度展示的办公系统将数小时工作缩短至分钟级 [7] - 从工具思维转向协作伙伴思维 智能体具备自主决策和任务规划能力 [7] 企业战略转型 - 科技巨头从展示大模型转向展示Agent应用 智谱AI AutoGLM模型实现跨平台任务执行包括抢红包 电商下单等操作 [5] - 交付模式从SaaS转向RaaS(结果即服务) 强调实际交付结果而非功能数量 [9][11] - MiniMax Agent展示全栈开发能力 半小时内生成可运行的横版冒险游戏框架 [9][13] 市场应用扩展 - C端产品出现井喷式爆发 WPS灵犀支持自然语言多轮对话完成文档创作和演示文稿生成 [14] - Agent被确立为AI时代的软件形态产品 类比PC时代的网站和手机时代的App [14] 基础设施发展 - 阿里云发布"无影AgentBay"云基础设施 开发者仅需三行代码即可接入高性能环境 [16] - PPIO搭建全栈式Agent基础设施服务平台 包含国内首个Agent沙箱和模型服务 [17] - 星环科技展示10分钟打造AI产业问答智能体 将数周开发过程极致压缩 [17] - 月之暗面聚焦开发者工具型模型 主力模型Kimi K2主打代码能力和Agentic任务处理 [17]
如何在企业中大规模应用Agent?|2025 ITValue Summit 前瞻对话「AI落地指南特别篇」②
钛媒体APP· 2025-08-01 06:52
公司动态 - 易点天下发布AI Drive2 0数智营销解决方案及全球多渠道全托管AI营销专家AdsGo ai 通过Multi-Agent和AI Workflow封装成7x24小时工作的智能体系 [1] - AdsGo ai实现从"程序化自动化"到"智能化自动化"跨越 内测阶段帮助初创企业提升广告策略多样性5倍 素材测试效率提升10倍 节省人力成本65% 单次转化费用降低26% 点击率提升47% 放量效率提升132% [2] - 公司构建包括KreadoAI Funsdata Cycor CyberGrow等产品矩阵 形成覆盖营销全链路的AI智能体系 [1] 技术应用 - Agent应用已实现全岗位渗透 覆盖产研(AI Coding提效) 创意(AIGC素材生成) 运营(流程自动化) 信息化(审批/知识库)等环节 [3] - 区分泛Agent(20+个AI+RPA工具)与专业Agent 后者需具备意图理解 任务拆解 自主调动 长上下文记忆及多Agent状态感知能力 [4][38] - 专业Agent通过多智能体协作重构营销全链路 包括投前洞察 素材生产 投放优化 数据分析等环节 [4] 发展阶段 - Agent演进分三阶段:以模型为中心(单点能力) → 以任务为中心(复杂工作流编排) → 以目标为中心(自动拆解任务+多Agent协同) [12][13] - 以目标为中心的Agent需自动调度工具 保持状态感知和长上下文记忆 如公司内部ALL IN ONE AI"易精灵"处理会议预定等复杂场景 [19][21] - 当前80%工作场景可由Agent处理 如SEO全链路自动化执行(关键词挖掘→落地页优化→数据反馈) [10][15] 实施路径 - 企业构建Agent需四步:统一AI认知 加大Token消耗投入 梳理业务SOP 成立专职Agent团队 [6][31][39] - 需建立AI中台架构 底层接入多服务商模型 中层构建微调模型 上层开发面向业务的Agent应用 [23][40] - 开发周期包括SOP梳理 技术选型 工具接入等 简单Agent需1-2人 复杂工程化Agent需十余团队协作 [25][26] 行业影响 - Agent应用推动人机协同范式变革 如产品经理直接生成网页代码 管理层通过Agent筛选基层汇报 组织架构趋于扁平化 [30] - 企业私有知识库和非结构化数据应用将成为未来竞争壁垒 需提前布局文档归类与FAQ结构化积累 [24][32][43] - AI+与+AI模式并存 前者创建统一交互入口 后者赋能传统系统 共同降低SaaS软件学习成本 [28][29][44]
从“老场景”的“新解法”下手,突破Agent落地难题| 2025 ITValue Summit前瞻WAIC现场版:AI落地指南系列
钛媒体APP· 2025-08-01 06:39
人工智能的产业化进程,早已超越概念探索,正以 "老场景,新解法"的范式,静默却深刻地重构各行各 业。在钛媒体2025 ITValue Summit前瞻WAIC现场版:AI落地指南系列的直播中,科锐国际CTO刘之与 钛媒体联合创始人刘湘明聚焦人力资源服务领域,深入探讨了Agent(智能体)的实际落地路径。 当前人力资源领域,招聘相关的AI新应用层出不穷。面对尚未收敛的技术环境,科锐国际CTO刘之强 调务实策略:回归核心业务流程("老场景"),寻找颠覆性解决方案("新解法"),通过小范围验证成 功后再规模化复制。 从"老场景"出发,寻找AI单点突破 "AI仍处早期,技术变革仍在进行,新场景和新商业模式或需两三年才能成型。现阶段,我们更关注如 何用AI革命性地解决既有痛点。" 刘之在对话明确表示。同时,他提出了通用 Agent 工作记忆的三难困 境:长上下文窗口、有效注意力和高信息密度的三者不可能同时实现,并且认为Agent落地可以从问题 清晰度和费力度两个维度出发进行选择。 AI应用三阶段:从信息检索到智能决策 刘之将生成式AI在业务中的应用演进划分为清晰的三阶段:第一个阶段是 ChatGPT阶段:重塑知识获 取 ...
2025上半年AI核心成果及趋势报告-量子位智库
搜狐财经· 2025-08-01 04:37
应用趋势 - 通用类Agent产品深度整合工具使用,可完成数小时人类工作量的自动化任务,交付内容丰富[1][13] - 以视觉操作为核心的Computer Use Agent(CUA)推向市场,正与文本类深度研究Agent融合[1][14] - 垂直场景加速Agent化,自然语言操控成工作流一部分,AI编程获市场验证,收入增长迅猛[1][16][17] - 头部编程应用收入增长速度创纪录,不同应用达到5亿美元年收入所需时间缩短至2年[17][18] - 模型上下文协议(MCP)受关注但尚未规模化落地,可为大模型Agent提供技术支撑[1][19] 模型趋势 - 推理能力持续提升,数理和代码类问题进步显著,部分模型在国际竞赛中表现优异(如代码竞赛准确率提升+129%)[21][22] - 大模型工具使用能力增强,端到端融合视觉与文本,多模态推理能力提升[1][25][26] - 图像生成控制能力、审美等全面增强,普通用户可仅通过自然语言进行复杂图像编辑[28] - 视频生成模型整合原生配音,可控性和物理规律协调性增强(如Veo 3支持音画同步生成)[29] - 小模型加速普及(如Qwen3-0.6B/1.7B/4B),降低部署门槛[30] 技术趋势 - 资源投入向后训练和强化学习倾斜,强化学习重要性提升,未来算力消耗或超预训练[1][33] - 多智能体系统成前沿范式,在线学习有望成下一代学习方式[1] - Transformer架构及混合架构快速迭代优化,代码验证成AI编程自动化提升的前沿[1] 行业趋势 - xAI的Grok 4跻身全球第一梯队,证明大模型无护城河[2] - 算力成关键竞争要素,头部玩家计算集群规模达数十万卡且持续扩张[2] - OpenAI领先优势弱化,谷歌和xAI迎头赶上,中美通用大模型差距缩小[2] - 中国在多模态领域表现突出,AI编程成必争之地,国内外头部玩家密集布局[2][17]
AI产业速递:MetaFY25Q2收入利润再超预期,AI生态加速构建
长江证券· 2025-08-01 02:35
报告行业投资评级 - 看好,维持 [7] 报告的核心观点 - Meta 2025Q2 财报营收利润超预期,印证海外 AI 应用高景气度,投资—模型—应用—货币化闭环加速跑通,持续看好 Agent 商业化元年及投资机遇 [2] 根据相关目录分别进行总结 事件描述 - 北京时间 7 月 31 日凌晨,Meta 发布 2025Q2 财报,营收 475.2 亿美元,同比+22%,高于彭博一致预期;净利润 183.4 亿美元,同比+36%,高于彭博一致预期;资本支出 170.1 亿美元,同比+101% [2][4] 业务拆分 - AI 驱动广告业务量价齐升,应用家族板块 25Q2 总营收 471 亿美元,同比+22%,6 月平均 DAP 为 34.8 亿,同比增长 6%,广告收入 466 亿美元,同比+21%,广告数量同比增加 11%、单广告均价同比增长 9%,其他收入 5.83 亿美元,同比+50%;现实实验室板块 Q2 营收 3.7 亿美元,同比+5%,得益于 AI 眼镜销量增加 [10] 未来指引 - 预计 2025Q3 营业收入 475 - 505 亿美元,同比增长 17% - 24%;2025 年全年支出 1140 - 1180 亿美元,同比增长 20% - 24%;2025 年资本支出 660 - 720 亿美元,略高于先前预测;2026 年将继续加大 AI 投资 [10] AI 生态构建 - AI 应用提升广告系统效率和收益,Instagram、Facebook 广告转化率分别提升 5%与 3%,近 200 万广告商使用视频生成等功能;AI 设备用户数及保留率增长,雷朋 Meta 眼镜销售加速,推出新的高性能 AI 眼镜 Oakley Meta HSTN;AI 模型层面,Q2 招募人才,建立 Meta Super Intelligence Labs [10] 投资建议 - 关注 AI Agent 相关厂商、云服务厂商、与大厂合作的 IDC [10]