核心产品升级 - 推出混合推理架构 单一模型同时支持思考与非思考双模式 用户可通过深度思考按钮自由切换[5][7] - 上下文窗口扩展至128K 显著提升长文本处理能力[7] - 采用思维链压缩技术 思考模式输出token数量减少20%-50% 非思考模式输出长度也显著缩短[12] 智能体性能突破 - 工具使用与智能体任务表现通过后训练优化大幅提升[8] - 编程智能体在SWE-bench评测达66.0分 较V3-0324版本45.4分提升45%[9] - 多语言代码修复能力达54.5分 较前代29.3分提升86%[9] - 终端命令行评测31.3分 较前代13.3分增长135%[9] - 搜索智能体在browsecomp中文测试达49.2分 较前代35.7分提升38%[11] 技术架构创新 - 基础模型在V3版本基础上额外训练840B tokens[15] - 采用UE8M0 FP8 Scale参数精度 分词器与chat template较V3版本有重大变更[15] - 提供Strict Mode Function Calling Beta接口 确保输出严格符合Schema定义[14] - 新增Anthropic API格式兼容 可无缝接入Claude Code等框架[14] 开源生态建设 - 基础模型与后训练模型已在Huggingface和魔搭平台全面开源[15][19] - 开源组织路径分别为HUGGINGFACE.CO/DEEPSEEK-AI和MODELSCOPE.CN/ORGANIZATION/DEEPSEEK-AI[19] 商业化进程 - 新版价格表将于2025年9月6日凌晨生效 同时取消夜间时段优惠[16] - 当前至9月6日前为过渡期 仍按原价格政策计费[16] - API服务资源已完成扩容以支持新定价策略[16]
DeepSeek-V3.1 发布,官方划重点:Agent、Agent、Agent!
Founder Park·2025-08-21 08:16