Workflow
文档对话智能体
icon
搜索文档
谷歌抢跑L3级AI,Gemini连续工作40分钟,Agent自动生成评审百条创意
量子位· 2025-11-19 01:37
文章核心观点 - 谷歌Gemini企业版通过多智能体竞赛系统和长时思考能力,在单一任务上实现连续40分钟自主运行,标志着公司在L3级代理型AI的实践上取得领先突破 [1][2][3][4][6][7][10][11][12][19][20][21][26][27][29][30][31][32][33][35][36][37] 多智能体竞赛系统技术架构 - 系统整合多智能体工作流、长时思考与对抗式生成三大要素,通过"时间换质量"策略提升输出内容的结构化程度与洞察力 [10][11][12] - 具体流程包括:接收主题与评估标准后大规模生成100+初始创意,再由多个智能体以竞赛方式评分排序,最终产出附带概述、细节、评论及完整评审记录的结构化报告 [13][14][15] - 系统在正式运行前会先提供"计划评估项目和创意维度"概要,需用户确认后才执行任务,以优化需求确认与算力使用效率 [21] 应用场景与产品化进展 - 当前预览版推出创意生成与合作科研两大场景:前者针对主题生成排序创意,后者侧重科研任务的数据驱动评估 [17][18] - 同步测试的文档对话智能体支持上传最大30MB的PDF文件,将长文档内容整合至模型上下文,提升信息提取质量 [23][25][26] - 功能均集成于Gemini企业版,虽处开发阶段,但已展现通过企业级算力支撑复杂任务执行与迭代优化的能力 [26][32] L3级AI行业意义与发展趋势 - L3级AI核心定义为"代理能力",要求AI在用户授权下自主执行任务并持续运行多天,Gemini的40分钟连续运行为行业向L3迈进提供实践范本 [27][29][30][31][32] - 行业预测显示技术迭代加速:网友推测明年可能出现连续工作3小时的智能体,Anthropic则给出2026年实现8小时连续运行的时间线 [33][35] - 长期展望认为人类角色将逐步聚焦于问题设计与标准制定,Agent有望通过持续进化触及L4级创新者门槛 [36][37]