刚刚,Gemini 3再次大更新!全球免费享Pro级智商,奥特曼又要失眠了
创业邦·2025-12-18 03:40

核心观点 - 谷歌发布Gemini 3 Flash模型,以显著提升的速度、大幅降低的成本和接近旗舰模型的性能,对OpenAI和Anthropic等竞争对手构成直接挑战,旨在通过“性价比”和“速度”抢占市场 [5][6][18] - 该模型在多项基准测试中表现超出预期,部分成绩甚至与自家旗舰Gemini 3 Pro相当,打破了“质量-成本-速度”难以兼顾的传统认知 [11][13][14] - 谷歌的战略是双管齐下:一方面通过极具竞争力的API价格争夺企业和开发者市场;另一方面将AI能力深度集成到其拥有数十亿用户的消费级产品中,培养用户习惯和依赖 [32][41][44] 产品发布与定位 - Gemini 3 Flash正式发布,官方称其速度比Gemini 2.5 Pro快3倍,价格仅为Gemini 3 Pro的四分之一 [5] - 谷歌产品线现提供三种模型:Gemini 3 Flash (Fast) 主打快速响应;Gemini 3 Flash (Thinking) 具备轻量化推理能力;Gemini 3 Pro 仍是处理极高难度任务的首选 [9][10] - 该模型为推理型模型,能根据任务复杂度自适应调整“思考”时间,优化资源使用效率 [19] 性能表现 - 在GPQA Diamond博士级推理测试中,Gemini 3 Flash获得90.4%的成绩,与更大体积的前沿模型相当 [13] - 在Humanity‘s Last Exam测试中,无需工具辅助得分为33.7% [13] - 在MMMU Pro多模态理解与推理测试中,以81.2%的成绩达到业界最先进水平,与Gemini 3 Pro的81.0%表现相当 [13] - 在SWE-bench Verified编码测试中获得78.0%的分数,高于Gemini 3 Pro的76.2% [14][19] - 在Toolathlon长周期真实世界软件任务测试中,以49.4%的分数超过Gemini 3 Pro的36.4% [14] - 在部分任务的实际体验中,其生成效果在视觉与交互细节上逊于Gemini 3 Pro,存在图标缺失、效果粗糙等问题 [26][28][30] 成本与效率 - 定价极具竞争力:输入价格为每百万Token 0.5美元,输出价格为每百万Token 3美元 [14][37] - 相比前代,Token消耗减少30%,速度快3倍 [16] - 若使用上下文缓存,重复Token的成本可再节省90%;使用Batch API异步处理可再节省50%成本并提升调用上限 [39] 技术特点与应用场景 - 具备多模态能力,能快速处理视觉、音频等输入,适合需要即时反馈的交互场景 [19] - 应用场景强调实时性与迭代效率,例如实时游戏辅助推理、UI设计生成与A/B测试、图像识别与交互式注释生成等 [22][23][25] - 可分析视频(如高尔夫挥杆)并快速给出建议,或实时识别草图并预测意图 [19] 市场与生态战略 - 模型正被集成到谷歌“全家桶”中,包括Gemini应用、搜索AI模式、Vertex AI、Google AI Studio等,并向全球用户免费开放体验 [35][36] - 谷歌将Gemini 3 Flash嵌入搜索的AI模式,能理解复杂问题细节,抓取实时信息,输出更清晰有条理的综合答案 [33] - 谷歌凭借搜索、YouTube、Gmail、Google Maps等每日数十亿用户流量的产品,能将AI服务无感地融入用户最熟悉的场景,构建竞争壁垒 [41][42] - 公司在TPU、数据中心、分布式训练等基础设施和工程优化上的积累,是其能够压低成本的关键优势 [44]