行业核心观点 - 2025年AI行业最重要的变化是Agent真正进入工作流,重构了设计师等工作方式,并渗透进各行各业的办公场景 [1] - 行业正从单一AI工具向一站式多模态Agent创作平台演进,大厂正迅速取代创业公司成为竞争主角 [18] - 行业竞争已从“晋级赛”进入“淘汰赛”,竞争是全方位的,包括多模态模型和生态协同 [19] - 未来Agent的核心赛点在于能否渗透进复杂工作现场并长期驻扎,成为人类的“长期协作伙伴”而非一次性交付工具 [20][21] AI Agent的衡量标准与代际分层 - 基于对多款产品的调研,一站式AI Agent可拆分为三个关键层级架构 [3] - 衡量AI Agent竞争力的三个核心标准是:1) 支持全模态一站式内容生成 2) 具备强大的知识库以沉淀知识和记忆 3) 拥有良好的人机协作框架 [5][6] - 通过对国内5家主流大厂系Agent的实测,发现行业出现3次代际分层:1) 有能力生产完整工作流 2) 有能力形成数据闭环 3) 有能力持续积累认知与记忆,目前仅两家跨进第三阶段 [2] 主要产品功能与多模态能力对比 - 百度GenFlow3.0是目前唯一具备全模态创作能力的平台,覆盖AI写作、智能PPT、AI作图、AI视频、AI播客、AI编程等核心能力 [9] - 夸克与金山WPS位列第二梯队,能支撑绝大多数常见创作与办公场景 [9] - 字节扣子空间与腾讯ima在多模态能力、文档工具链及专业功能上存在缺口,产品形态尚处完善爬坡期 [9] - 在Office兼容性上,WPS和GenFlow3.0实现“原生级兼容”,支持全套Office编辑;扣子空间、夸克和ima仅提供基础或部分编辑能力 [10] 人机协作与交互能力深度 - 决定用户体验差异的关键从“能不能生成”转向人类“能不能随时接管和修正” [10] - 大多数Agent仍沿用“单向执行”逻辑,启动后难以打断,造成算力与时间浪费 [12] - 主流产品普遍采取“前置确认”策略以规避风险,例如GenFlow3.0、扣子空间、ima和夸克会在生成前确认提纲与风格 [12] - GenFlow3.0展现出差异化交互形态,不仅具备“前置确认”,更首创“断点续写”能力,允许用户在生成过程中随时暂停干预并动态纠偏,标志着AI协作从“指令式”迈向“交互式” [12][13] 知识库与数据闭环能力 - 知识库体验的鸿沟在于它是死板的“仓库”还是自然流动的“知识引擎” [13] - 在知识获取环节,ima的优势在于深度整合腾讯生态内容(如腾讯文档、微信公众号);夸克的优势在于通过浏览器入口便捷收集碎片化信息;GenFlow3.0的优势在于“专”,能获取百度文库和百度学术的海量独家专业文档、学术论文等 [14][15] - 在知识应用环节,夸克存在“存储-应用”断层,收藏内容无法在创作中直接调用;ima因工具链单薄,能调用知识库的场景寥寥无几 [17] - WPS依托云盘打通全端文件,构建了“素材存储-内容创作”的标准闭环 [17] - GenFlow3.0构建了更立体的“四重资料体系”,连接外部专业知识与内部各端数据,并让AI生成内容一键回流至知识库参与再创作,实现了“收、存、用”的完整内循环 [15][17] 产品代际定位总结 - 百度GenFlow3.0被定位为第三代Agent,支持多模态、知识闭环与执行中断 [7] - 字节扣子空间被定位为第二代+,核心功能完整、流程完整,但协作与知识库待完善 [7] - 金山WPS被定位为第二代,侧重Office场景、编辑能力强,但AI能力未充分挖掘 [7] - 阿里夸克被定位为第一代+,功能强大、知识获取便捷,但未构成知识闭环 [7] - 腾讯ima被定位为第一代,知识库强大,但内容生成能力较窄 [7]
年终盘点:谁会成为中国的"Nano Banana"?