谷歌抢跑L3级AI,Gemini连续工作40分钟,Agent自动生成评审百条创意
36氪·2025-11-19 08:03

核心观点 - 谷歌Gemini企业版通过多智能体竞赛系统和长时思考能力,在AI代理自主执行任务方面取得显著进展,向OpenAI定义的L3级代理型AI迈出重要一步[1][15] - 该系统能连续运行40分钟处理同一任务,通过生成—竞争—筛选流程产出结构化结果,提升了任务复杂度和人机协作效率[2][7][10] 技术能力突破 - 单次推理可持续时长达到40分钟,结合对抗式生成产出结构化、有洞见的内容[10] - 多智能体系统整合工作流、长时思考、对抗式生成,用时间换取输出质量[7] - 系统可大规模生成100+条初始创意,并由多个Agent以竞赛方式评分排序,最终提供包含概述、细节、评论及完整评审记录的报告[2][7] 应用场景 - 创意生成:用户提供主题后,系统启动多智能体竞赛流程生成并排序相关创意[9] - 合作科研:用户指定研究主题并提供数据,由智能体生成和评估科研类任务创意[9] - 文档对话智能体:允许用户上传最大30MB的PDF文件,直接与文档内容对话,从长文档中提取高质量结论[12][14] 行业意义与发展前景 - 此次尝试被视为向L3级人工智能产品迈进的重要探索,L3的核心在于代理能力及长时间自主运行[14][15] - 有推测指出,明年可能出现连续工作3小时的Agent,Anthropic给出的时间线是2026年实现连续工作8小时[15][17] - 随着合作科研功能进一步开发,Gemini可能触及L4(创新者)门槛[18]