Workflow
量子位智库:2025上半年AI核心成果及趋势报告
搜狐财经·2025-08-02 23:06

应用趋势 - 通用类Agent深度整合工具使用,可完成多样深度研究任务,视觉操作为核心的CUA推向市场,两者正走向融合 [1][11] - 垂类Agent在旅行、设计等场景涌现,自然语言操控成为工作流一部分,例如飞猪推出"问一问"功能实现多Agent协同 [1][15] - AI编程成核心垂类,头部应用如Cursor年收入突破5亿美元,产品演化经历代码补全、单文件编辑、多文件编辑到端到端交付四阶段 [16][17] - 模型上下文协议MCP受关注但未规模化落地,可为大模型提供标准化接口,目前支持20-30个调用且生态技术侧尚未成熟 [19][21] 模型趋势 - 推理能力显著提升,数理类问题准确率+7%,代码类竞赛排名+23%,GPQA钻石级问题+43% [24] - 大模型走向Agentic,工具使用能力增强,Humanity's Last Exam榜单表现+81% [26] - 多模态推理融合视觉与文本,图像生成能力全面提升,可遵循16个细节指令并实现多轮连续编辑 [27][29] - 小模型加速普及,智能密度提高,模型评估向动态、实用任务方向发展 [1][25] 技术趋势 - 训练资源向后训练和强化学习倾斜,强化学习重要性提升,未来算力消耗或超预训练 [1][10] - 多智能体系统成前沿范式,在线学习成核心突破方向,Transformer架构快速迭代并涌现混合架构 [1][27] - 代码验证成AI编程自动化提升关键方向,系统提示词对用户体验影响显著 [1][18] 行业趋势 - 头部玩家模型层差距缩小,OpenAI领先优势弱化,谷歌和xAI迎头赶上 [2][8] - 中美大模型竞争差距缩小,中国在多模态等领域表现突出 [2][8] - AI编程成必争之地,海内外头部玩家密集布局,国内大模型创业公司路线分化 [2][16]