Workflow
DeepSeek模型升级
财联社·2025-09-22 13:54

注: Search Agent的工具集与上一版有所不同,具体工具细节请查看HuggingFace文档 目前,官方App、网页端、小程序与DeepSeek API模型 均已 同步 更新为DeepSeek- V 3.1-Terminus。 此次更新在保持模型原有能力的基础上,针对用户反馈的问题进行了改进,包括: DeepSeek-V3.1-Terminus的输出效果相比前一版本更加稳定,新模型各领域测评结果如下: 语言一致性 : 缓解了中英文混杂、偶发异常字符等情况 ; Agent能力 : 进一步优化了Code Agent与Search Agent的表现。 | Benchmark | DeepSeek-V3.1 | DeepSeek-V3.1 | | --- | --- | --- | | | | -Terminus | | | 非 Agent 测评(thinking 模式) | | | MMLU-Pro | 84.8 | 85.0 | | GPQA-Diamond | 80.1 | 80.7 | | Humanity's Last Exam | 15.9 | 21.7 | | LiveCodeBench | 7 ...