DeepSeek V3.1更新「最终版」!下一次是V4/R2了???
量子位·2025-09-23 03:14
模型更新与性能改进 - DeepSeek-V3.1-Terminus版本发布 主要针对用户反馈问题修复 包括缓解中英文混杂和偶发异常字符问题[2][3] - 新版本优化Code Agent与Search Agent表现 提升AI Agent能力[7][8] - 模型评测显示Terminus版本在多数基准测试中表现提升 包括MMLU-Pro从84.8提升至85.0 GPQA-Diamond从80.1提升至80.7 Humanity's Last Exam从15.9大幅提升至21.7[9] - Agent能力显著增强 BrowseComp从30.0提升至38.5 SimpleQA从93.4提升至96.8 SWE Verified从66.0提升至68.4 SWE-bench Multilingual从54.5提升至57.8[9] 版本命名与未来规划 - Terminus版本名称暗示可能是V3系列最终版本 下一步可能推出V4或R2架构[5][7][11] - 公司被曝预计2024年底推出新模型 重点发展更强大AI Agent能力[8][14] - 部分基准测试出现性能波动 如Codeforces评分从2091下降至2046 引发用户讨论[9][10] 模型获取与行业动态 - 新模型已在Hugging Face和ModelScope平台开放下载[15] - 行业正在开展2025人工智能年度榜单评选 设立企业 产品 人物三大维度五类奖项[15]