Workflow
L3级人工智能
icon
搜索文档
谷歌抢跑L3级AI,Gemini连续工作40分钟,Agent自动生成评审百条创意
36氪· 2025-11-19 08:03
核心观点 - 谷歌Gemini企业版通过多智能体竞赛系统和长时思考能力,在AI代理自主执行任务方面取得显著进展,向OpenAI定义的L3级代理型AI迈出重要一步[1][15] - 该系统能连续运行40分钟处理同一任务,通过生成—竞争—筛选流程产出结构化结果,提升了任务复杂度和人机协作效率[2][7][10] 技术能力突破 - 单次推理可持续时长达到40分钟,结合对抗式生成产出结构化、有洞见的内容[10] - 多智能体系统整合工作流、长时思考、对抗式生成,用时间换取输出质量[7] - 系统可大规模生成100+条初始创意,并由多个Agent以竞赛方式评分排序,最终提供包含概述、细节、评论及完整评审记录的报告[2][7] 应用场景 - 创意生成:用户提供主题后,系统启动多智能体竞赛流程生成并排序相关创意[9] - 合作科研:用户指定研究主题并提供数据,由智能体生成和评估科研类任务创意[9] - 文档对话智能体:允许用户上传最大30MB的PDF文件,直接与文档内容对话,从长文档中提取高质量结论[12][14] 行业意义与发展前景 - 此次尝试被视为向L3级人工智能产品迈进的重要探索,L3的核心在于代理能力及长时间自主运行[14][15] - 有推测指出,明年可能出现连续工作3小时的Agent,Anthropic给出的时间线是2026年实现连续工作8小时[15][17] - 随着合作科研功能进一步开发,Gemini可能触及L4(创新者)门槛[18]
谷歌抢跑L3级AI,Gemini连续工作40分钟,Agent自动生成评审百条创意
量子位· 2025-11-19 01:37
文章核心观点 - 谷歌Gemini企业版通过多智能体竞赛系统和长时思考能力,在单一任务上实现连续40分钟自主运行,标志着公司在L3级代理型AI的实践上取得领先突破 [1][2][3][4][6][7][10][11][12][19][20][21][26][27][29][30][31][32][33][35][36][37] 多智能体竞赛系统技术架构 - 系统整合多智能体工作流、长时思考与对抗式生成三大要素,通过"时间换质量"策略提升输出内容的结构化程度与洞察力 [10][11][12] - 具体流程包括:接收主题与评估标准后大规模生成100+初始创意,再由多个智能体以竞赛方式评分排序,最终产出附带概述、细节、评论及完整评审记录的结构化报告 [13][14][15] - 系统在正式运行前会先提供"计划评估项目和创意维度"概要,需用户确认后才执行任务,以优化需求确认与算力使用效率 [21] 应用场景与产品化进展 - 当前预览版推出创意生成与合作科研两大场景:前者针对主题生成排序创意,后者侧重科研任务的数据驱动评估 [17][18] - 同步测试的文档对话智能体支持上传最大30MB的PDF文件,将长文档内容整合至模型上下文,提升信息提取质量 [23][25][26] - 功能均集成于Gemini企业版,虽处开发阶段,但已展现通过企业级算力支撑复杂任务执行与迭代优化的能力 [26][32] L3级AI行业意义与发展趋势 - L3级AI核心定义为"代理能力",要求AI在用户授权下自主执行任务并持续运行多天,Gemini的40分钟连续运行为行业向L3迈进提供实践范本 [27][29][30][31][32] - 行业预测显示技术迭代加速:网友推测明年可能出现连续工作3小时的智能体,Anthropic则给出2026年实现8小时连续运行的时间线 [33][35] - 长期展望认为人类角色将逐步聚焦于问题设计与标准制定,Agent有望通过持续进化触及L4级创新者门槛 [36][37]