Workflow
帕累托边界
icon
搜索文档
谷歌甩出“价格屠夫”,Gemini 3 Flash超Pro,成本仅1/4,速度如“闪电”
36氪· 2025-12-18 03:09
产品发布与核心定位 - 谷歌发布Gemini 3 Flash模型,旨在以更低成本提供前沿智能水平 [1] - 该模型专为迭代式开发打造,能够以低延迟提供接近Gemini 3 Pro级别的编程性能 [6] - 模型将Gemini 3 Pro级别的推理能力与Flash级别的延迟、效率和成本相结合 [5] 成本与定价优势 - 输出每百万token的价格仅为Claude Sonnet 4.5的20%、GPT-5.2的21% [1] - 与Gemini 3 Pro相比,Flash的价格仅为Pro的25% [1] - 具体定价为:输入每百万token 0.50美元,输出每百万token 3.00美元 [9] - 根据典型流量测量,其平均比Gemini 2.5 Pro少使用30%的tokens [11] 性能表现与基准测试 - 在MMMU-Pro基准测试中达到81.2%的分数,与Gemini 3 Pro相当 [8] - 在SWE-bench Verified基准测试中取得78%的成绩,超越了Gemini 2.5系列和Gemini 3 Pro [8] - 在GPQA Diamond基准测试中达到90.4%,在Humanity's Last Exam(无工具)中达到33.7% [8] - 在AIME 2025数学基准测试(无工具)中达到95.2% [9] - 在几乎所有基准测试上都超过了Claude Sonnet 4.5、Gemini 2.5 Pro等模型 [8] 功能与应用场景 - 能够实现多模态推理,近乎实时地提供AI辅助,例如在手部追踪的“弹球解谜游戏”中 [6] - 可近乎实时地构建和A/B测试新的加载动画设计,简化从设计到代码的流程 [6] - 使用多模态推理快速分析带有上下文UI覆盖层的图像并生成字幕,将静态图像转化为交互式体验 [6] - 适合进行复杂视频分析、数据提取和视觉问答的开发者 [6] - 可分析短视频内容并提供可操作计划,例如改进高尔夫挥杆 [6] - 支持“用嘴编程”,仅用语音输入即可在几分钟内将非结构化想法转化为功能正常的应用程序 [7] - 可识别用户知识盲点,创建自定义测验并对答案给出详细解释 [7] 技术特点与效率 - 针对速度进行优化,可以在用户绘图时就“看到”并猜出所画内容 [7] - 能够自动调节思考量,对于更复杂的用例可能会思考更长时间 [11] - 推动了模型质量与成本、速度之间的帕累托边界 [9] 市场影响与战略意义 - Gemini 3 Flash补全了Gemini 3家族在轻量化、高性价比方面的布局 [12] - 其更高性价比有望帮助人工智能更广泛地嵌入日常应用和商业系统 [12] - 模型目前已全面开放,开发者可通过Google AI Studio、Gemini API等平台使用,普通用户可通过Gemini应用程序和谷歌搜索中的AI模式使用 [5]