Workflow
Seek .(SKLTY)
icon
搜索文档
深度求索正式发布DeepSeek-V3.2-Exp模型
北京商报· 2025-09-29 12:58
北京商报讯(记者 魏蔚)9月29日,深度求索正式发布 DeepSeek-V3.2-Exp 模型,在 V3.1-Terminus 的 基础上引入了 DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行 了探索性的优化和验证。目前,官方 App、网页端、小程序均已同步更新为 DeepSeek-V3.2-Exp,同时 API (应用程序编程接口)大幅度降价。在新的价格政策下,开发者调用 DeepSeek API 的成本将降低 50% 以上。 ...
DeepSeek,新版本
中国证券报· 2025-09-29 12:39
DeepSeek-V3.2-Exp模型发布 - 9月29日DeepSeek发布实验性版本DeepSeek-V3.2-Exp 在V3.1-Terminus基础上引入稀疏注意力机制以优化长文本训练和推理效率 [1] - 新模型服务成本大幅降低使API价格下调超过50% 所有终端平台同步更新 [1] - 华为昇腾实现0day支持并开源推理代码 在128K长序列下保持TTFT低于2秒和TPOT低于30毫秒的推理性能 [3] 寒武纪适配与优化进展 - 寒武纪同步适配DeepSeek-V3.2-Exp并开源vLLM-MLU推理引擎源代码 支持开发者在其软硬件平台体验新模型 [1] - 通过Triton算子开发和BangC融合算子实现快速适配与性能优化 达成业界领先计算效率水平 [2] - 长期支持主流开源大模型生态 此前对DeepSeek系列已实现业界领先算力利用率 [2] 华为昇腾技术部署 - 基于vLLM/SGLang推理框架完成适配部署 开源所有推理代码和算子实现 [3] - 在CANN平台完成BF16模型优化适配 采用大EP并行方案与CP并行策略兼顾时延和吞吐 [3] DeepSeek模型迭代历程 - 8月21日发布DeepSeek-V3.1 9月22日升级至Terminus版本 改进语言一致性问题并缓解中英文混杂及异常字符情况 [3]
DeepSeek-V3.2-Exp模型发布并开源,API价格大幅下调
36氪· 2025-09-29 12:12
模型发布与更新 - DeepSeek-V3.2-Exp模型于9月29日正式发布并在Huggingface与魔搭平台开源 官方App、网页端和小程序同步更新为V3.2-Exp版本 [1] - 新版本为实验性模型 引入DeepSeek Sparse Attention稀疏注意力机制 针对长文本训练和推理效率进行优化验证 [1] - 华为昇腾已基于vLLM/SGLang推理框架完成适配部署 实现DeepSeek-V3.2-Exp 0day支持 并向开发者开源所有推理代码和算子实现 [1] 技术架构创新 - 稀疏注意力机制首次实现细粒度稀疏化 在几乎不影响输出效果前提下大幅提升长文本训练和推理效率 [1] - 新模型研发使用TileLang高级语言进行快速原型开发 最终阶段以TileLang为精度基线改用底层语言实现高效版本 [2] - 开源算子包含TileLang与CUDA两种版本 官方建议研究性实验使用TileLang版本便于调试和快速迭代 [2] 性能评估与迭代历程 - V3.2-Exp训练设置与V3.1-Terminus严格对齐 在各领域公开评测集表现基本持平 [5] - 8月21日发布的V3.1版本采用混合推理架构 同时支持思考与非思考模式 相比DeepSeek-R1-0528思考效率更高 [4] - 9月22日更新至V3.1-Terminus版本 优化语言一致性缓解中英文混杂问题 并强化Code Agent与Search Agent能力 [4] 商业化进展 - 新模型服务成本大幅降低 API价格相应下调超过50% [4] - V3.1版本通过Post-Training优化显著提升工具使用与智能体任务表现 [4]
降价!DeepSeek,大消息!
证券时报网· 2025-09-29 12:07
大消息。 9月29日,DeepSeek宣布,正式发布DeepSeek-V3.2-Exp模型。作为迈向新一代架构的中间步骤,V3.2-Exp在V3.1-Terminus的基础上引入了DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化和验证。 据了解,DeepSeek Sparse Attention(DSA)首次实现了细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大幅 提升。 为了严谨地评估引入稀疏注意力带来的影响,DeepSeek特意把DeepSeek-V3.2-Exp的训练设置与V3.1-Terminus进行了严格的对齐。在各领域的公开评测集 上,DeepSeek-V3.2-Exp的表现与V3.1-Terminus基本持平。 | | Benchmark | DeepSeek-V3.1- | DeepSeek-V3.2-Exp | | --- | --- | --- | --- | | | | Terminus | | | | MMLU-Pro | 85.0 | 85.0 | | General | GP ...
“价格屠夫”DeepSeek上线,新模型成本下降超50%
第一财经· 2025-09-29 11:50
卷不过,根本卷不过。 被称为"价格屠夫"的DeepSeek再次挥刀降价了。 9月29日晚间,DeepSeek宣布正式发布 DeepSeek-V3.2-Exp模型,性能仍是稳步提升,但出乎意料的是,调用价格大幅降低,尤其输出价格大降75%,业界人 士表示"这很难卷得过"。DeepSeek提到,在新价格政策下,开发者调用DeepSeek API的成本将降低50%以上。 具体来看,输入价格上,缓存命中时,DeepSeek-V3.2-Exp从0.5元/百万tokens降至0.2元/百万tokens,缓存未命中的价格则从4元/百万tokens降为2元/百万 tokens;输出价格上,从12元/百万tokens直接降到了3元/百万tokens。 此外,为支持社区研究,DeepSeek 还开源了新模型研究中设计和实现的 GPU 算子,包括 TileLang 和 CUDA 两种版本。团队建议社区在进行研究性实验 时,优先使用基于 TileLang 的版本,以便于调试和快速迭代。 值得一提的是,就在9月22日,DeepSeek才发布了DeepSeek-V3.1-Terminus模型,Terminus在拉丁语里是终点、界限的意思 ...
DeepSeek V3.2和智谱GLM-4.6即将发布
证券日报网· 2025-09-29 11:46
本报讯 (记者梁傲男)9月29日,记者注意到,DeepSeek在Huggingface上架DeepSeek-V3.2-base的页面。 另外,记者获悉,智谱的新一代旗舰模型GLM-4.6也即将发布。目前,在Z.ai官网可以看到,GLM-4.5标识为上一代旗舰模 型。 官网截图 (编辑 张昕) ...
DeepSeek-V3.2-Exp模型正式发布并开源 官方大幅下调API价格
智通财经网· 2025-09-29 10:53
智通财经APP获悉,9月29日,深度求索正式发布DeepSeek-V3.2-Exp模型,这是一个实验性(Experimental)的版本。模型引入稀疏注意力架构,针对长文本 的训练和推理效率进行了探索性的优化和验证。目前,官方App、网页端、小程序均已同步更新为 DeepSeek-V3.2-Exp,同时API大幅度降价,有效降低开 发者调用DeepSeek API的成本。 据DeepSeek介绍,作为迈向新一代架构的中间步骤,V3.2-Exp 在 V3.1-Terminus 的基础上引入了一种稀疏注意力机制——DeepSeek Sparse Attention(DSA),针对长文本的训练和推理效率进行了探索性的优化和验证。 DSA首次实现了细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大幅提升。 目前,该模型已正式上架华为云大模型即服务平台MaaS,针对DeepSeek-V3.2-Exp模型,华为云此次仍沿用大EP并行方案部署,基于稀疏注意力结构叠加 实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能。 为了严谨地评估引入稀疏注意力带来的影响,DeepSeek团队特 ...
DeepSeek新模型上线华为云
第一财经· 2025-09-29 10:51
9月29日,华为云表示,目前已完成对 DeepSeek-V3.2-Exp 模型的适配工作,最大可支持160K长序列上 下文长度。目前,该模型已正式上架华为云大模型即服务平台 MaaS。 目前,该模型已正式上架华为云大模型即服务平台 MaaS。 ...
DeepSeek-V3.2-Exp正式发布 API大幅降价
证券时报网· 2025-09-29 10:29
人民财讯9月29日电,DeepSeek今天宣布,正式发布DeepSeek-V3.2-Exp模型。官方App、网页端、小程 序均已同步更新为DeepSeek-V3.2-Exp,同时API大幅度降价。在新的价格政策下,开发者调用 DeepSeekAPI的成本将降低50%以上。 ...
DeepSeek-V3.2-Exp 发布,训练推理提效,API成本降50%以上
新浪科技· 2025-09-29 10:27
目前,官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp,同时API大幅度降价。在新的价 格政策下,开发者调用DeepSeek API的成本将降低50%以上。DeepSeek-V3.2-Exp 模型现已在 Huggingface 与魔搭开源。 责任编辑:刘万里 SF014 在各领域的公开评测集上,DeepSeek-V3.2-Exp 的表现与 V3.1-Terminus 基本持平。(文猛) 新浪科技讯 9月29日晚间消息,DeepSeek发布DeepSeek-V3.2-Exp模型。据悉,这是一个实验性 (Experimental)的版本,作为迈向新一代架构的中间步骤,V3.2-Exp在V3.1-Terminus的基础上引入了 DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化 和验证。 ...