别再把 Gemini 3 当作更强的 ChatGPT
36氪·2025-11-20 12:32

产品发布核心观点 - Gemini 3 Pro预览版正式上线,标志着公司在经过长时间预热和竞争对手的行业动态后,推出了一次重大的模型与生态系统升级[1] - 此次升级的核心被定位为不仅是模型能力的提升,更是一次围绕Google全家桶的“系统更新”,旨在将模型深度整合至公司各类产品中[3] - 公司的战略意图是利用Gemini 3作为一条新的“智能总线”,将其原生多模态和智能体能力渗透至搜索、应用、Workspace和开发者工具等核心产品线,从而重塑用户交互和工作流体验[23][26][27] 模型性能表现 - 在多项高难度学术基准测试中,Gemini 3 Pro全面超越了前代Gemini 2.5 Pro及主要竞品(Claude Sonnet 4.5, GPT-5.1)[5] - 在推理能力上表现突出,例如在Humanity‘s Last Exam测试中,无工具辅助得分为37.5%,使用搜索和代码执行后提升至45.8%,显著高于GPT-5.1的26.5%[5] - 数学能力强劲,在AIME 2025测试中无工具得分为95%,使用代码执行后达到100%[5] - 在多模态理解上领先,如在MMMU-Pro测试中得分为81.0%,高于GPT-5.1的76.0%[5] - 在智能体任务上优势明显,如在Vending-Bench 2测试中平均净值为5,478.16美元,远高于Claude Sonnet 4.5的3,838.74美元和GPT-5.1的1,473.43美元[5] - 官方定位其为“博士级推理模型”,并强调其Deep Think模式在解决新类型问题上的能力提升[6] 核心技术:原生多模态 - 公司强调Gemini 3的核心技术优势在于“原生多模态”,即模型在预训练阶段就混合了文本、代码、图片、音频、视频等多种模态数据,而非采用外挂子模型的“管线式”策略[8] - 该技术路径旨在减少信息处理流水线,从而降低信息损耗,保留更完整的语气、画面细节和时间顺序,为应用层带来革命性影响[8][9] - 这一特性被认为是行业的分水岭,将迫使竞争对手加速淘汰旧有范式,未来“原生多模态”将成为基本配置[24] 产品整合与应用 - 模型发布同时,公司即将搜索栏的AI模式更新为由Gemini 3驱动的动态内容区,可生成摘要、结构化卡片和时间轴等[10] - AI模式支持生成沉浸式视觉布局、交互式工具和模拟等新的生成式UI体验[13] - 在Gemini App中,模型被定位为“思考伙伴”和“超级个人助理”,覆盖学习、生活和轻办公场景,例如分析视频生成训练计划、整理混合文档等[13][15] - 在API侧,Gemini 3 Pro被定位为最适合智能体编码和氛围编码,展现出强大的整装式生成应用工具能力[15][17] 开发者工具创新 - 公司发布了新的IDE产品Antigravity,其设计理念是“以AI为主角”的开发环境,允许多个AI智能体直接访问编辑器、终端和浏览器并分工协作[18] - 所有操作被记录为“Artifacts”,方便人类审查,展示了模型从逻辑设计到前后端代码实现的端到端开发能力[18][21] - 测试案例显示,仅凭简单指令,Gemini即可独立完成一个完整招聘网站的分析、构建和部署[18][21] 行业影响与竞争格局 - Gemini 3的发布将推动行业竞争从单纯比拼云端参数和算力的“上半场”,转向比拼终端落地能力和用户体验的“下半场”[26] - 模型强大的原生多模态和智能体规划能力,将对依赖“截图+OCR”等技术路线的模型厂商以及专注于智能体工作流的创业公司构成直接挤压[24][26] - 结合苹果等公司与模型大厂合作的趋势,行业竞争焦点将延伸至手机、眼镜、汽车等终端设备的模型落地体验[26] - 行业的核心问题将从“谁的模型更强”转变为“谁的能力真正长在产品上、长在用户身上”[26]