双子座3专业版(Gemini 3.0 Pro)
搜索文档
DeepSeek重磅上新,对标美国行业巨头,“所有群聊都炸锅了!”
新浪财经· 2025-12-02 10:24
新品发布与性能表现 - 公司于12月1日推出两款正式版模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale [1] - DeepSeek-V3.2定位“平衡实用”,在主流推理基准测试中达到GPT-5水平,仅略低于Gemini-3.0-Pro [1][4] - DeepSeek-V3.2-Speciale为“极致推理”版本,在推理基准测试中性能媲美谷歌Gemini 3.0 Pro [1][4] - V3.2-Speciale在国际数学奥林匹克竞赛(IMO 2025)、国际信息学奥林匹克竞赛(IOI 2025)等均斩获金牌级表现,其中ICPC成绩达人类选手第二名,IOI成绩达人类选手第十名 [1][5] - 在具体基准测试中,V3.2-Speciale在AIME 2025得分为96.0(23k),HMMT Feb 2025得分为99.2(27k),CodeForces得分为2701(77k) [6] 技术特点与产品优势 - DeepSeek-V3.2在智能体评测中达到当前开源模型最高水平,大幅缩小开源模型与闭源模型的差距 [4] - V3.2是公司推出的首个将思考融入工具使用的模型,同时支持思考模式与非思考模式的工具调用 [4] - V3.2相比Kimi-K2-Thinking输出长度大幅降低,显著减少计算开销与用户等待时间 [4] - V3.2-Speciale结合了DeepSeek-Math-V2的定理证明能力,具备出色的指令跟随、严谨的数学证明与逻辑验证能力 [4] - 官方网页端、App和API均已更新为正式版V3.2,Speciale版本以临时API服务形式开放,相关模型已开源 [5] 行业影响与专家评价 - 新品发布恰逢2025年神经信息处理系统大会(NeurIPS)召开前夕,引发AI研究领域广泛热议 [1][2] - 专家表示DeepSeek发布新模型的消息使所有相关交流群“炸开了锅”,研究人员若现身NeurIPS会场将引发高度关注 [2] - 谷歌深度思维首席研究工程师苏珊·张称赞技术报告内容详尽,肯定公司在模型训练后稳定性优化及智能体能力提升方面的努力 [7] - 彭博社指出该成果表明中国开源AI系统至少在部分核心指标上已与硅谷顶尖专有模型具备同等竞争力 [7] - Hugging Face首席执行官盛赞用户可免费拥有“世界上最优秀数学家之一的大脑”,并强调AI和知识民主化的最佳体现 [7] 行业格局与战略对比 - 过去一年中国团队开发的开源AI模型下载量占比上升至17%,首次超越美国开发团队的15.8% [8] - 与美国OpenAI、谷歌等科技巨头的“封闭”策略不同,中国科技公司倾向于更加开放的策略,发布一系列开源模型 [9] - 德国智库分析师指出开源在中国更像是一种主流趋势,而美国公司不愿公开商业机密 [9] - MIT研究员表示中国科技公司正在改变AI模型发布范式,许多公司每周或每两周发布一次模型,而美国公司往往每六个月或一年才发布 [9] - 业内人士认为尽管有芯片出口管制,中国拥有大量优秀人才,在开发开源模型中展现出极强创造力 [10]