Workflow
混合推理架构
icon
搜索文档
「AI新世代」R2没等来先发V3.1!DeepSeek深陷大模型“包围圈”热度炙烤
华夏时报· 2025-08-22 06:49
DeepSeek V3.1版本更新 - 公司于8月21日发布V3.1版本而非市场期待的R2版本[2] - 新版本采用混合推理架构同时支持思考模式和非思考模式实现R1和V3的合体[4] - 相比5月版本V3.1响应速度更快且具备更强Agent能力API上下文扩展至128K[5] 用户反馈与模型调整 - 部分用户对新版本不满在评论区呼吁恢复R1版本并催促推出多模态模型[2][6] - 公司已将官方网页端App小程序及API开放平台调用模型全部更新为DeepSeek-V3[3] - R1版本转换标识已从网页端和手机端移除[3] 定价策略变更 - API接口调用价格自9月6日起调整为输入0.5元/百万tokens缓存命中4元/百万tokens缓存未命中输出12元/百万tokens[5] - 新定价为V3和R1标准价格的中和版V3原价为输入0.5/2元输出8元R1原价为输入1/4元输出16元[5] - 取消每日00:30至08:30夜间时段优惠此前该时段V3价格降50%R1价格降75%[5] 行业竞争态势 - 智谱于8月20日推出全球首个手机Agent采用GLM-4.5和GLM-4.5V模型具备多模态能力[7] - 月之暗面7月11日发布KimiK2模型阶跃星辰7月25日推出Step-3多模态推理模型阿里发布通义千问3推理模型百川智能8月11日开源医疗增强模型Baichuan-M2[8] - 国外厂商同步推进OpenAI推出GPT-5Anthropic发布Claude Opus 4.1谷歌发布Genie 3交互世界模型xAI宣布开源Grok 2模型[8][9] 公司市场表现 - 公司网站访问量连续4个月下降平均每月降低9.63%6月访问量为3.8亿[10] - App月活用户6月出现首次下滑7月继续下降11.87%至8293万[10] - 同期字节豆包月活达1.32亿腾讯元宝月活达4473万保持增长[10] 技术发展趋势 - 混合推理架构成为行业趋势阿里通义千问Qwen3和GPT-5均采用类似架构[4] - 该架构可平衡快速获取信息和深度分析需求提升工作效率并降低token消耗量[4] - 行业处于螺旋式上升状态企业间竞争激烈但尚无绝对领先者[9]
DeepSeek-V3.1正式发布,叫板OpenAI,适配下一代国产芯片
凤凰网· 2025-08-21 09:18
技术架构升级 - 混合推理架构同时支持思考模式与非思考模式 实现性能稳定与需求适配的平衡 [1] - 思维链压缩训练使生成结果token数量减少20%至50% 显著提升响应速度并降低使用成本 [1] - 128K上下文扩展与FP8精度推理强化工程层面吞吐效率与能耗表现 支撑大规模应用 [1] 智能体能力进化 - 在代码修复和命令行任务等编程场景中展现更强执行力与稳定性 支持多轮迭代修正 [1] - 复杂搜索任务具备成熟检索整合能力 可规划搜索步骤并综合多源信息 多学科题目性能远超前代模型 [1] 商业生态策略 - API服务价格将于9月6日调整并取消夜间优惠 同时Base模型与后训练版本在Hugging Face和魔搭平台开源 [2] 硬件适配与行业对标 - 采用UE8M0 FP8 Scale参数精度 适配新一代国产芯片技术规范 改善国产芯片部署性能 [4] - 支持超长上下文与复杂任务处理 基础模型调用灵活且成本弹性 形成与GPT5的对标态势 [4]
DeepSeek-V3.1正式发布:混合推理,Agent能力大幅提高!概念股直线拉升
每日经济新闻· 2025-08-21 08:27
产品升级 - 公司正式发布DeepSeek-V3.1版本 引入混合推理架构 支持思考模式与非思考模式自由切换[1] - 新模型思考效率显著提升 相比DeepSeek-R1-0528版本能在更短时间内给出答案[1] - 通过Post-Training优化 模型在工具使用与智能体任务中的表现获得较大提升[1] 服务更新 - 官方App与网页端模型同步升级为DeepSeek-V3.1 用户可通过"深度思考"按钮切换模式[1] - API接口同步升级 deepseek-chat对应非思考模式 deepseek-reasoner对应思考模式 上下文扩展至128K[1] - API Beta接口支持strict模式Function Calling 确保输出满足schema定义[1] - 新增对Anthropic API格式的支持 可接入Claude Code框架[1] 价格调整 - 公司将于2025年9月6日凌晨起执行新版API价格表 同时取消夜间时段优惠[2] - 9月6日前所有API服务仍按原价格政策计费[4] 技术特性 - DeepSeek-V3.1采用UE8M0 FP8 Scale参数精度[4] - 该精度方案针对下一代国产芯片设计[4] 市场反应 - DeepSeek概念股尾盘出现拉升走势[4]
DeepSeek-V3.1发布:更高效思考、更强Agent能力、更长上下文
生物世界· 2025-08-21 08:00
混合推理架构 - 引入混合推理架构 支持深度思考模式和非思考模式自由切换[2][3] - 深度思考模式适用于数学计算和复杂逻辑分析等深度推理任务 推理效率更高[3] - 非思考模式适用于日常对话和信息查询等轻量级任务 响应更迅速[4] Agent能力提升 - 通过Post-Training优化大幅提升工具使用和智能体任务表现[6] - 编程智能体在代码修复和命令行终端任务中表现优于前代模型 所需轮数更少效率更高[6] - 搜索智能体在多步推理搜索和多学科专家级难题测试中性能大幅领先DeepSeek-R1-0528[7] - SWE-bench指标达到66.0 较DeepSeek-V3-0324的45.4提升45%[7] - Terminal-Bench指标达到31.3 较DeepSeek-V3-0324的13.3提升135%[7] - Browsecomp指标达到30.0 较DeepSeek-R1-0528的8.9提升237%[8] - Browsecomp中文指标达到49.2 较DeepSeek-R1-0528的35.7提升38%[8] 思考效率优化 - 采用思维链压缩训练 输出Token减少20%-50%的情况下任务表现仍与DeepSeek-R1-0528持平[9] - 实现更快的响应速度和更低的API调用成本[9] API升级 - 上下文扩展至128K 处理长文档能力增强[10][12] - 新增strict模式Function Calling 确保函数调用符合Schema定义[12] - 支持Anthropic API格式 可接入Claude Code框架[12] 模型开源与定价 - Base模型和后训练模型已在Hugging Face和魔搭平台开源[11] - 使用UE8M0 FP8 Scale参数精度 分词器和chat template有较大调整[11] - API价格自2025年9月6日起执行新版价格表并取消夜间时段优惠[11]
DeepSeek-V3.1正式发布
第一财经· 2025-08-21 07:53
产品升级 - DeepSeek-V3 1正式发布 采用混合推理架构 同时支持思考模式与非思考模式 [3] - 相比DeepSeek-R1-0528 新模型思考效率提升 可在更短时间内给出答案 [3] - 通过Post-Training优化 新模型在工具使用与智能体任务中表现有较大提升 [3] 平台服务更新 - 官方App与网页端模型已同步升级为DeepSeek-V3 1 用户可通过深度思考按钮自由切换思考模式与非思考模式 [3] - API同步升级 deepseek-chat对应非思考模式 deepseek-reasoner对应思考模式 上下文扩展至128K [3] - API Beta接口支持strict模式Function Calling 确保输出Function满足schema定义 [3] - 增加对Anthropic API格式支持 可轻松将DeepSeek-V3 1能力接入Claude Code框架 [4] 价格调整 - 北京时间2025年9月6日凌晨起 执行新版API接口调用价格表 取消夜间时段优惠 [4] - 9月6日前所有API服务仍按原价格政策计费 [6]
官宣!DeepSeek-V3.1 发布,API调用价格低至0.5元/百万Tokens
新浪科技· 2025-08-21 07:05
API价格调整 - 公司将于北京时间2025年9月6日00:00起调整DeepSeek开放平台API接口调用价格 [1] - 输入价格调整为缓存命中0.5元/百万tokens 缓存未命中4元/百万tokens [1] - 输出价格调整为12元/百万tokens [1] 技术升级 - 新版本DeepSeek-V3.1采用混合推理架构 支持思考模式与非思考模式自由切换 [3] - 相比DeepSeek-R1-0528版本 新模型思考效率显著提升 能在更短时间内给出答案 [3] - 通过Post-Training优化 模型在工具使用与智能体任务中的表现获得较大提升 [3] 产品部署 - 官方App与网页端模型已同步升级至DeepSeek-V3.1版本 [3] - 用户可通过"深度思考"按钮实现思考模式与非思考模式的自由切换 [3]
DeepSeek-V3.1发布
证券时报网· 2025-08-21 07:01
DeepSeek-V3 1升级 - 混合推理架构:一个模型同时支持思考模式与非思考模式 [1] - 更高的思考效率:相比DeepSeek-R1-0528,DeepSeek-V3 1-Think能在更短时间内给出答案 [1] - 更强的Agent能力:通过Post-Training优化,新模型在工具使用与智能体任务中的表现有较大提升 [1]