谷歌抢跑L3级AI，Gemini连续工作40分钟，Agent自动生成评审百条创意

核心观点 - 谷歌Gemini企业版通过多智能体竞赛系统和长时思考能力，在AI代理自主执行任务方面取得显著进展，向OpenAI定义的L3级代理型AI迈出重要一步[1][15] - 该系统能连续运行40分钟处理同一任务，通过生成—竞争—筛选流程产出结构化结果，提升了任务复杂度和人机协作效率[2][7][10] 技术能力突破 - 单次推理可持续时长达到40分钟，结合对抗式生成产出结构化、有洞见的内容[10] - 多智能体系统整合工作流、长时思考、对抗式生成，用时间换取输出质量[7] - 系统可大规模生成100+条初始创意，并由多个Agent以竞赛方式评分排序，最终提供包含概述、细节、评论及完整评审记录的报告[2][7] 应用场景 - 创意生成：用户提供主题后，系统启动多智能体竞赛流程生成并排序相关创意[9] - 合作科研：用户指定研究主题并提供数据，由智能体生成和评估科研类任务创意[9] - 文档对话智能体：允许用户上传最大30MB的PDF文件，直接与文档内容对话，从长文档中提取高质量结论[12][14] 行业意义与发展前景 - 此次尝试被视为向L3级人工智能产品迈进的重要探索，L3的核心在于代理能力及长时间自主运行[14][15] - 有推测指出，明年可能出现连续工作3小时的Agent，Anthropic给出的时间线是2026年实现连续工作8小时[15][17] - 随着合作科研功能进一步开发，Gemini可能触及L4（创新者）门槛[18]