Gemini 3 Deep Think 模型发布与性能 - 谷歌正式上线最新最强模型Gemini 3 Deep Think,其推理能力表现突出[2] - 新模型在复杂数学、科学推理和逻辑问题上相比前代有大幅提升,旨在解决最强模型都难以处理的问题[9] - 模型采用迭代推理的“深度思考”模式,能多轮打磨代码,生成更精细程序,在可视化、原型设计和实验方面交付细节更丰富的结果[9] - 模型底层技术衍生于曾在IMO、ICPC World Finals上获得金牌的Gemini 2.5 Deep Think,并借助更先进的并行推理机制,可同时从多个思路进攻高难度问题[14][15] 模型演示与能力展示 - 模型能将草图转化为逼真的3D场景,结构、镂空花纹与光影处理到位[3] - 能用几句话搭建出运行丝滑的3D多米诺骨牌解压游戏[4] - 用户可与其进行视觉艺术创作,在虚拟宇宙中探索[5] 基准测试表现 - 在Humanity‘s Last Exam基准测试中,Gemini 3 Deep Think在不使用工具的前提下准确率达到41.0%,比GPT-5 Pro高出10个百分点[10] - 在ARC-AGI-2基准测试中,其代码执行准确率达到前所未有的45.1%,比Gemini 3 Pro高14%,领先GPT-5.1近30%[11] - 根据提供的基准测试数据表,Gemini 3.0 Pro在多项测试中表现优异,例如在HMMT Feb 2025哈佛MIT数学竞赛中得分为97.5,在LiveCodeBench世界级编程竞赛中得分为90.7,在GPQA Diamond理工科博士生测试中得分为91.9[26] 定价策略与市场反馈 - Gemini 3 Deep Think目前仅向Ultra会员开放,月费为249.9美元,折合人民币约1800元[18] - 该定价策略引发Pro用户强烈不满,用户认为未提供试用额度或按次付费选项,难以判断模型价值[18][21] - 与竞争对手相比,OpenAI为Plus用户提供每周100条o3模型额度,谷歌此策略被指“小气”[23] - 模型发布后市场反响平平,评论区焦点集中于吐槽定价[24] 行业竞争格局 - 谷歌在Gemini 3 Pro取得优势后,迅速推出Gemini 3 Deep Think,被描述为“不给对手任何喘息的机会”[8] - 竞争对手DeepSeek近期更新的V3.2版本在推理能力上直逼Gemini 3 Pro,同样获得了IMO 2025、ICPC World Finals 2025等竞赛金牌,且为开源模型,对谷歌形成直接竞争压力[25][26] - 行业观点认为,DeepSeek作为开源模型,正像一条“大鲶鱼”一样搅动整个行业[28]
谷歌最强大模型付费上线,在DeepSeek开源后被吐槽太贵