Workflow
Gemini 3.0 Flash
icon
搜索文档
AI 产业跟踪:谷歌正式发布 Gemini 3.0 Flash,关注大模型降本与商业化落地进展
长江证券· 2025-12-21 09:53
行业投资评级 - 投资评级为“看好”,并维持此评级 [9] 报告核心观点 - 谷歌正式发布Gemini 3.0 Flash,旨在以更低成本提供前沿智能,标志着AI行业进入商业化落地阶段,降本成为产业系统性趋势 [2][5] - AI的变现仍依赖现有互联网商业模式,过往生态重要,头部玩家马太效应显著,是此轮AI商业化落地的关键 [2][11] - 基模是模型家族的根基,Flash版本的强大建立在强基模基础上进行蒸馏 [2][11] 事件描述与产品定位 - 2025年12月18日,谷歌正式发布Gemini 3.0 Flash,面向所有用户推出 [2][5] - 该模型定位为“为速度而生的前沿智能”,试图打破AI领域“性能、成本、速度”难以兼得的不可能三角 [11] - 谷歌策略明确,旨在通过Flash系列巩固其在高频、实时、大规模部署场景下的优势 [11] 产品性能与成本优势 - 在多项基准测试中表现卓越:在GPQA Diamond达到90.4%,在MMMU Pro达到81.2%,超过GPT-5.2的79.5%,并大幅领先Claude Sonnet 4.5;在SWE-bench Verified达到78%,超越Gemini 3 Pro的76.2% [11] - 实现了“低成本”与“高智能”并行,定价具有显著优势:输入价格为0.5美元/百万tokens,输出价格为3美元/百万tokens;作为对比,Claude Sonnet 4.5输出价格为15美元/百万tokens,GPT-5.2输出价格为14美元/百万tokens,是Gemini 3.0 Flash的近5倍 [11] - 保留了Gemini 3的多模态、复杂推理和智能体能力,将Pro级别的推理能力与Flash级别的延迟、效率和成本结合 [11] - 在典型流量测量下,以更高性能完成日常任务时,平均比前代Gemini 2.5 Pro少使用30%的tokens [11] 商业化落地进展 - 迅速在企业级战场找到立足点,在工业级场景处理非结构化数据,如在复杂财务数据识别和长篇合同交叉引用等任务上实现15%的准确率提升 [7] - 企业得以在可控成本下,部署具备前沿推理与快速响应双重优势的AI解决方案,AI正从可用到好用,商业化落地加速 [7] - 高阶推理正在转变为大众检索的标准化基础设施,本次更新普惠性显著 [11] 后续展望与关注方向 - 后续需关注AI产品发布超预期情况与AI Agent落地进展 [11] - 报告持续看好国产AI链、国产算力链以及国内AI出海,持续重点推荐相关产业链公司及卡位优势显著的巨头 [8][11]
OpenAI图像模型实测口碑两极分化,被调侃“画风辣眼”
第一财经· 2025-12-17 08:37
就在谷歌暗示将发布Gemini 3.0 Flash模型时,OpenAI抢先发布了其新一代图像模型GPT Image 1.5,对标谷歌的Nano Banana。从跑分来看已经超过谷歌夺得第一,不过实际用户测试反馈呈现两极 分化,不少人认为其AI味较重。 本文字数:2087,阅读时长大约4分钟 作者 | 第一财经 刘晓洁 封图 | AI生成 2025.12. 17 为了制造话题,OpenAI直接拿CEO奥尔特曼(Sam Altman)当案例演示生图效果。而奥尔特曼本人 也晒出了自己用GPT Image 1.5生成的"消防员写真年历",被调侃"画风辣眼"。 OpenAl @OpenAI most likely to launch a new image model OpenAI表示,这一代模型具备更强的指令遵循,更精准的图像编辑,也能较好地保留细节,生成速度 是上一代模型的4倍。新的图像模型今天在ChatGPT中面向所有用户推出,并在API中作为GPT Image 1.5提供。 这次OpenAI还实施了降价措施,GPT Image 1.5中的图像输入和输出比上一代便宜了20%,因此用户 可以在相同的预算下生成和迭代 ...
跑分第一,实战拉胯,GPT Image 1.5被骂惨,奥特曼这波悬了
36氪· 2025-12-17 08:27
OpenAI深夜祭出大招,全新GPT Image 1.5重磅出世,拿下榜单双料第一,实力碾压谷歌Nano Banana Pro。但全网实测,骂声一片。 谷歌刚传出要发Gemini 3.0 Flash,结果OpenAI反手就是一个「王炸」。 就在刚刚,OpenAI抛出了它的「圣诞彩蛋」——新一代旗舰图像模型ChatGPT Images正式登场。 这一次,OpenAI将生图能力直接拉满: 精准操控: 指令理解力大幅提升,真正做到「指哪改哪」。 细节狂魔: 画面细节保留完整,质感细腻。 极速生成: 速度较前代提升了整整4倍。 而且从今天起,所有ChatGPT免费用户即可上手,开发者也可直接调用GPT Image 1.5 API。 在LMArena竞技场上,它似乎不可战胜: 文生图:以1264 Elo分登顶榜首,力压谷歌Nano Banana Pro(NBP)。 图像编辑:chatgpt-image-latest以3分优势险胜NBP夺冠,而GPT Image 1.5紧随其后位列第4。 在Artificial Analysis上,更是拿下了「双料第一」。 | Rank 14 | Rank Spread O (Upper ...
反击谷歌!OpenAI图像模型冲上榜首,实测口碑却两极分化
第一财经· 2025-12-17 08:09
OpenAI发布新一代图像模型GPT Image 1.5 - 公司发布新一代图像模型GPT Image 1.5,对标谷歌的Nano Banana,并在ChatGPT中面向所有用户推出,同时在API中提供 [4] - 新一代模型具备更强的指令遵循、更精准的图像编辑和更好的细节保留能力,生成速度是上一代模型的4倍 [4] - 公司实施了降价措施,GPT Image 1.5的图像输入和输出价格比上一代便宜了20% [4] 模型性能与市场排名 - 在Artificial Analysis竞技场测评中,GPT Image 1.5在文生图和图像编辑两项功能上均位列第一,超越了排在第二的谷歌Nano Banana Pro [4] - 在文生图项目中,GPT Image 1.5领先优势达46分,在图像编辑项目上则高出4分 [4] - 与早期的OpenAI图像模型相比,GPT Image 1.5展现出更高的图像质量和更快的保真度 [5] 定价策略 - GPT Image 1.5按token定价,价格取决于分辨率和质量设置 [4] - 高质量1MP图像的价格约为每千张133美元,低质量图像价格约为每千张9美元 [4] 与主要竞品谷歌Nano Banana Pro的对比 - 实际用户测试反馈呈现两极分化,不少人认为新模型AI味较重 [1] - 在画面质感和提示词遵循上,GPT Image 1.5表现更好,但对中文支持明显不足,生成文字错误频出 [6][8] - 在文字准确性上,谷歌Nano Banana Pro占优,但在构图指令遵循上屡屡失误 [6][9] - 从整体审美来看,GPT Image 1.5的输出更符合大众喜好,但在准确性和中文支持上,谷歌Nano Banana Pro略胜一筹 [11] - 有评测指出,在生动的图像上GPT Image 1.5表现很好,但在信息图表上表现糟糕 [12] 用户反馈与行业评价 - 更多普遍的反馈是,ChatGPT生成的图片看起来比谷歌的Nano Banana Pro假得多,例如背景虚化过度导致“AI味儿”重 [17] - 行业人士认为,谷歌Nano Banana Pro在真实感与自然度上的优势,对电商、创意等落地场景更为有利 [21] - 此次旗舰图像模型的更新被认为是对谷歌竞争的一次回击,但并非颠覆式飞跃,用户评价两极分化 [21] - 图片更真实、没有“AI味”被视作商业化落地的关键,公司仍需在真实感塑造上向竞争对手看齐 [21]
前端危,Gemini 3内测结果获网友一致好评,“有史以来最强前端开发模型”
36氪· 2025-10-13 23:51
产品性能与能力 - 下一代旗舰模型Gemini 3在编程领域表现卓越,尤其擅长前端开发和SVG矢量图生成,被网友称为“有史以来最出色的前端和网页开发模型”[1] - 模型多模态能力显著增强,能够根据简短提示词直接生成可运行的黑洞可视化效果、带动画的SVG以及原创钢琴曲[1] - 在号称最难的“人类最后考试HLE基准”上,Gemini 3.0取得32.4%的最高分,性能超过GPT-5(high)和Grok 4[10] - 模型物理原理理解能力提升,能正确应对“数手指”陷阱,在测试中准确回答出6根手指,而直接调用模型知识会错误回答5根[21] - 对于游戏背景图等要求更高的图像生成任务,Gemini 3.0能输出精致结果,例如绘制《我的世界》时几乎每一帧都透露着精致[15] 技术规格与架构 - Gemini 3预计推出两个版本:Gemini 3.0 Pro和Gemini 3.0 Flash[3] - Gemini 3.0 Pro采用MoE架构,拥有数万亿参数,但每次查询仅需激活150~200亿参数[4] - 模型上下文窗口从100万扩展至数百万,并内置深度思考模式和多模态功能,支持视频、图片、音频处理[4] - 在超高难度的通用智力测试ARC-AGI-2上,开启思考模式的Gemini 3.0准确率接近35%,而其他模型均在20%以下[6] 市场反应与测试反馈 - 模型未发布便已通过内测在社交媒体引发广泛关注,网友对其能力给予高度评价,并有人断言其已预定年度最佳模型[1] - 内测显示模型在零样本提示下能生成蕴含卡尔达舍夫等级3文明内容的演示网站,展现出强大推理能力[9] - 与之前版本相比,产品升级效果肉眼可见,例如在手柄渲染图生成上,Pro版本的输出与真实产品图相当接近,而几个月前测试Gemini 2.5 Ultra的结果则差距较大[12][13] - 在智能体函数调用方面,据网友爆料Gemini 3.0将带来新的改变,但具体细节因保密暂未透露[22] 产品发布计划 - 谷歌内部研究人员曾在国庆期间预热产品发布,坊间一度传闻上线时间为10月9日,但已被证伪[23] - 根据Reddit网友扒出的疑似谷歌内部文件,产品发布时间显示为10月22日[24] - 网友对正式上线版本表示期待,并希望公司不要对产品功能进行“阉割”[26]
谷歌Gemini 3.0「全家桶」年度压轴,前端不再需要人类,下周王者降临
36氪· 2025-10-13 02:15
产品发布与开发进度 - 谷歌下一代旗舰AI模型Gemini 3 0预计将于2025年10月22日正式发布[1][2] - 产品开发遵循明确的里程碑时间表 包括内部测试阶段如Teamfood已于2025年8月25日完成 Fishfood于2025年9月26日完成 后续将进行AIM Dogfood和Google Dogfood测试 最终发布和推广计划在2025年11月12日进行[2] - Gemini 3 0 Pro版本已在最新的Gemini CLI提交中被引用 表明技术集成已进入后期阶段[8] 产品规格与技术架构 - Gemini 3 0采用了混合专家模型架构 参数量超万亿 每次查询激活的参数量为150亿至200亿[9] - 模型的上下文长度从100万token跃升至数百万token 具备处理整本书籍或完整代码库的能力[9] - 产品家族预计将包含Gemini 3 0 Pro Gemini 3 0 Flash和Gemini 3 0 Ultra等多个版本[5][6] 功能演示与性能表现 - 模型在多项前端开发任务中表现出色 能够根据单一指令直接生成完整网页 复杂游戏和原创音乐[1][3][4] - 在具体测试中 Gemini 3 0能一次性成功生成如"太空侵略者"游戏 "城堡防御"游戏以及古代艺术博物馆网页等复杂内容[13][14] - 在视觉生成能力上表现突出 例如能生成遵循物理定律的3D六边形小球动画 并将"骑自行车的鹈鹕"这类测试提示转化为3D像素艺术 效果显著优于早期模型[3][17][26] 市场表现与开发背景 - Gemini系列产品在2025年9月实现了46 24%的环比增长率 增速高于ChatGPT Claude和Grok等其他同类产品[35] - Gemini 3 0 Pro的训练始于2025年4月 预训练阶段于2025年7月左右结束 之后进行了约2至3个月的后训练工作[38] - 其前代产品Gemini 2 5 Pro和Flash版本已于2025年6月17日进入正式状态[41]