新模型「屠榜」，对话谷歌团队：AI「新旗手」如何诞生

产品发布与市场反响 - 谷歌于11月19日正式发布Gemini 3 Pro模型，该模型在几乎所有主流基准测试中实现全面领先，被业内视为可能改写大模型竞争格局的“王牌”[1] - 发布后，OpenAI CEO奥尔特曼公开祝贺称其“看起来是个很棒的模型”，特斯拉CEO马斯克也评价“Nice work”，显示出行业对此次发布的高度关注[1] - 谷歌官方高调宣称该模型“开启智慧新纪元”，公司CEO桑达尔·皮查伊在社交媒体连发8条帖子介绍产品，员工也积极助阵[1] 基准测试性能表现 - 在“人类最后一次考试”基准测试中，Gemini 3 Pro在不使用工具的情况下取得37.5%的成绩，较第二名GPT-5.1的26.5%领先10个百分点[7] - GPQA Diamond测试中得分达91.9%，高于GPT-5.1的88.1%，显示其在科学与数学问题解决上的高可靠性[8] - 多模态能力方面，MMMU-Pro分数达81%，Video-MMMU分数达87.6%，刷新多模态推理纪录[9] - 数学能力测试AIME 2025中，无工具条件下得分95%，使用代码执行后达100%[7] - 长上下文性能测试MRCR v2中，128k上下文平均得分77%，1M上下文点状得分26.3%，显著优于竞品[7] 实际应用场景展示 - 用户测试显示，模型可一键生成高难度光影质感海报，复刻Mac OS网页时表现超出预期[11] - 谷歌DeepMind CEO哈萨比斯用模型在几小时内重现一款游戏，产品总监多西强调其生成3D可视化内容并直接游玩的体验[17] - 智能体模式可处理多步骤复杂任务，如梳理每日50多封邮件、筛选需回复邮件、购买演唱会门票等，显著提升效率[18][19] 商业化与生态整合 - 发布首日即将Gemini 3整合至谷歌搜索，增强搜索引擎推理能力并解锁生成UI体验，如交互式三体问题模拟界面[20][21] - 推出类IDE编程产品Antigravity，支持智能体自主规划执行端到端软件任务，模型通过API向开发者开放[24] - 月活跃用户已超6.5亿，1300万名开发者基于Gemini构建应用，搜索AI概览功能月用户超20亿[26] 技术优势与行业影响 - 谷歌通过全栈式技术方案（自研TPU芯片、计算集群等）实现三年内从追赶到领先的反超[4][27] - 行业认为谷歌可能托起AI牛市叙事，Loop Capital将母公司评级从“持有”上调至“买入”，目标股价从260美元调至320美元[26] - 公司市值一度突破3.5万亿美元创历史新高，巴菲特旗下伯克希尔重仓买入谷歌股票[26]