DeepSeek 重大发布
Seek .Seek .(US:SKLTY) 证券时报·2025-12-01 15:04

模型发布与更新 - DeepSeek于12月1日晚间正式发布两个模型:DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale [1] - 官方网页端、App 和 API 均已更新为正式版 DeepSeek-V3.2 [1] - DeepSeek-V3.2-Speciale 版本目前仅以临时 API 服务形式开放,供社区评测与研究 [1] 模型定位与核心能力 - DeepSeek-V3.2 的目标是平衡推理能力与输出长度,适合日常使用 [3] - 相比 Kimi-K2-Thinking,V3.2 的输出长度大幅降低,显著减少了计算开销与用户等待时间 [3] - DeepSeek-V3.2-Speciale 是 V3.2 的长思考增强版,目标是将开源模型的推理能力推向极致,探索模型能力边界 [3] - DeepSeek-V3.2-Speciale 结合了 DeepSeek-Math-V2 的定理证明能力 [3] 模型性能表现 - 在公开的推理类 Benchmark 测试中,DeepSeek-V3.2 达到了 GPT-5 的水平,仅略低于 Gemini-3.0-Pro [3] - DeepSeek-V3.2-Speciale 在主流推理基准测试上的性能表现媲美 Gemini-3.0-Pro [3] - DeepSeek-V3.2-Speciale 模型成功斩获 IMO 2025、CMO 2025、ICPC World Finals 2025 及 IOI 2025 金牌 [3] - 其中,ICPC 与 IOI 成绩分别达到了人类选手第二名与第十名的水平 [3] 基准测试数据详情 - 在 AIME 2025 测试中,DeepSeek-V3.2 得分为 93.1,DeepSeek-V3.2-Speciale 得分为 96.0 [4] - 在 HMMT Feb 2025 测试中,DeepSeek-V3.2 得分为 92.5,DeepSeek-V3.2-Speciale 得分为 99.2 [4] - 在 HMMT Nov 2025 测试中,DeepSeek-V3.2 得分为 90.2,DeepSeek-V3.2-Speciale 得分为 94.4 [4] - 在 IMOAnswerBench 测试中,DeepSeek-V3.2 得分为 78.3,DeepSeek-V3.2-Speciale 得分为 84.5 [4] - 在 LiveCodeBench 测试中,DeepSeek-V3.2 得分为 83.3,DeepSeek-V3.2-Speciale 得分为 88.7 [4] - 在 CodeForces 测试中,DeepSeek-V3.2 得分为 2386,DeepSeek-V3.2-Speciale 得分为 2701 [4] - 在 GPQA Diamond 测试中,DeepSeek-V3.2 得分为 82.4,DeepSeek-V3.2-Speciale 得分为 85.7 [4] - 在 HLE 测试中,DeepSeek-V3.2 得分为 25.1,DeepSeek-V3.2-Speciale 得分为 30.6 [4] 技术迭代与行业影响 - 中原证券研报认为,此前发布的实验性模型 DeepSeek-V3.2-Exp 基于 V3.1-Terminus 构建,引入了新的注意力机制 DSA [4] - 该机制在保持模型性能稳定的同时,在训练推理效率方面有较大提升,带来了模型较大幅度的降价 [4] - 考虑到当前大模型之间能力差距在缩小,成本的下降意味着模型具有更好的性价比和可推广性 [4] - 成本的下降也将促进应用端实现更多功能的落地 [4]