产品发布与市场反响 - 谷歌于11月19日正式发布Gemini 3 Pro模型,该模型在几乎所有主流基准测试中实现全面领先,被业内视为可能改写大模型竞争格局的“王牌”[1] - 发布后,OpenAI CEO奥尔特曼公开祝贺称其“看起来是个很棒的模型”,特斯拉CEO马斯克也评价“Nice work”,显示出行业对此次发布的高度关注[1] - 谷歌官方高调宣称该模型“开启智慧新纪元”,公司CEO桑达尔·皮查伊在社交媒体连发8条帖子介绍产品,员工也积极助阵[1] 基准测试性能表现 - 在“人类最后一次考试”基准测试中,Gemini 3 Pro在不使用工具的情况下取得37.5%的成绩,较第二名GPT-5.1的26.5%领先10个百分点[7] - GPQA Diamond测试中得分达91.9%,高于GPT-5.1的88.1%,显示其在科学与数学问题解决上的高可靠性[8] - 多模态能力方面,MMMU-Pro分数达81%,Video-MMMU分数达87.6%,刷新多模态推理纪录[9] - 数学能力测试AIME 2025中,无工具条件下得分95%,使用代码执行后达100%[7] - 长上下文性能测试MRCR v2中,128k上下文平均得分77%,1M上下文点状得分26.3%,显著优于竞品[7] 实际应用场景展示 - 用户测试显示,模型可一键生成高难度光影质感海报,复刻Mac OS网页时表现超出预期[11] - 谷歌DeepMind CEO哈萨比斯用模型在几小时内重现一款游戏,产品总监多西强调其生成3D可视化内容并直接游玩的体验[17] - 智能体模式可处理多步骤复杂任务,如梳理每日50多封邮件、筛选需回复邮件、购买演唱会门票等,显著提升效率[18][19] 商业化与生态整合 - 发布首日即将Gemini 3整合至谷歌搜索,增强搜索引擎推理能力并解锁生成UI体验,如交互式三体问题模拟界面[20][21] - 推出类IDE编程产品Antigravity,支持智能体自主规划执行端到端软件任务,模型通过API向开发者开放[24] - 月活跃用户已超6.5亿,1300万名开发者基于Gemini构建应用,搜索AI概览功能月用户超20亿[26] 技术优势与行业影响 - 谷歌通过全栈式技术方案(自研TPU芯片、计算集群等)实现三年内从追赶到领先的反超[4][27] - 行业认为谷歌可能托起AI牛市叙事,Loop Capital将母公司评级从“持有”上调至“买入”,目标股价从260美元调至320美元[26] - 公司市值一度突破3.5万亿美元创历史新高,巴菲特旗下伯克希尔重仓买入谷歌股票[26]
新模型「屠榜」,对话谷歌团队:AI「新旗手」如何诞生