L3级人工智能 - 财报，业绩电话会，研报，新闻

L3级人工智能

搜索文档

谷歌抢跑L3级AI，Gemini连续工作40分钟，Agent自动生成评审百条创意

36氪· 2025-11-19 08:03

核心观点 - 谷歌Gemini企业版通过多智能体竞赛系统和长时思考能力，在AI代理自主执行任务方面取得显著进展，向OpenAI定义的L3级代理型AI迈出重要一步[1][15] - 该系统能连续运行40分钟处理同一任务，通过生成—竞争—筛选流程产出结构化结果，提升了任务复杂度和人机协作效率[2][7][10] 技术能力突破 - 单次推理可持续时长达到40分钟，结合对抗式生成产出结构化、有洞见的内容[10] - 多智能体系统整合工作流、长时思考、对抗式生成，用时间换取输出质量[7] - 系统可大规模生成100+条初始创意，并由多个Agent以竞赛方式评分排序，最终提供包含概述、细节、评论及完整评审记录的报告[2][7] 应用场景 - 创意生成：用户提供主题后，系统启动多智能体竞赛流程生成并排序相关创意[9] - 合作科研：用户指定研究主题并提供数据，由智能体生成和评估科研类任务创意[9] - 文档对话智能体：允许用户上传最大30MB的PDF文件，直接与文档内容对话，从长文档中提取高质量结论[12][14] 行业意义与发展前景 - 此次尝试被视为向L3级人工智能产品迈进的重要探索，L3的核心在于代理能力及长时间自主运行[14][15] - 有推测指出，明年可能出现连续工作3小时的Agent，Anthropic给出的时间线是2026年实现连续工作8小时[15][17] - 随着合作科研功能进一步开发，Gemini可能触及L4（创新者）门槛[18]

谷歌抢跑L3级AI，Gemini连续工作40分钟，Agent自动生成评审百条创意

量子位· 2025-11-19 01:37

文章核心观点 - 谷歌Gemini企业版通过多智能体竞赛系统和长时思考能力，在单一任务上实现连续40分钟自主运行，标志着公司在L3级代理型AI的实践上取得领先突破 [1][2][3][4][6][7][10][11][12][19][20][21][26][27][29][30][31][32][33][35][36][37] 多智能体竞赛系统技术架构 - 系统整合多智能体工作流、长时思考与对抗式生成三大要素，通过"时间换质量"策略提升输出内容的结构化程度与洞察力 [10][11][12] - 具体流程包括：接收主题与评估标准后大规模生成100+初始创意，再由多个智能体以竞赛方式评分排序，最终产出附带概述、细节、评论及完整评审记录的结构化报告 [13][14][15] - 系统在正式运行前会先提供"计划评估项目和创意维度"概要，需用户确认后才执行任务，以优化需求确认与算力使用效率 [21] 应用场景与产品化进展 - 当前预览版推出创意生成与合作科研两大场景：前者针对主题生成排序创意，后者侧重科研任务的数据驱动评估 [17][18] - 同步测试的文档对话智能体支持上传最大30MB的PDF文件，将长文档内容整合至模型上下文，提升信息提取质量 [23][25][26] - 功能均集成于Gemini企业版，虽处开发阶段，但已展现通过企业级算力支撑复杂任务执行与迭代优化的能力 [26][32] L3级AI行业意义与发展趋势 - L3级AI核心定义为"代理能力"，要求AI在用户授权下自主执行任务并持续运行多天，Gemini的40分钟连续运行为行业向L3迈进提供实践范本 [27][29][30][31][32] - 行业预测显示技术迭代加速：网友推测明年可能出现连续工作3小时的智能体，Anthropic则给出2026年实现8小时连续运行的时间线 [33][35] - 长期展望认为人类角色将逐步聚焦于问题设计与标准制定，Agent有望通过持续进化触及L4级创新者门槛 [36][37]