Workflow
华为云大模型即服务平台MaaS
icon
搜索文档
DeepSeek-V3.2-Exp模型正式发布并开源 官方大幅下调API价格
智通财经网· 2025-09-29 10:53
智通财经APP获悉,9月29日,深度求索正式发布DeepSeek-V3.2-Exp模型,这是一个实验性(Experimental)的版本。模型引入稀疏注意力架构,针对长文本 的训练和推理效率进行了探索性的优化和验证。目前,官方App、网页端、小程序均已同步更新为 DeepSeek-V3.2-Exp,同时API大幅度降价,有效降低开 发者调用DeepSeek API的成本。 据DeepSeek介绍,作为迈向新一代架构的中间步骤,V3.2-Exp 在 V3.1-Terminus 的基础上引入了一种稀疏注意力机制——DeepSeek Sparse Attention(DSA),针对长文本的训练和推理效率进行了探索性的优化和验证。 DSA首次实现了细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大幅提升。 目前,该模型已正式上架华为云大模型即服务平台MaaS,针对DeepSeek-V3.2-Exp模型,华为云此次仍沿用大EP并行方案部署,基于稀疏注意力结构叠加 实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能。 为了严谨地评估引入稀疏注意力带来的影响,DeepSeek团队特 ...
DeepSeek新模型上线华为云
第一财经· 2025-09-29 10:51
9月29日,华为云表示,目前已完成对 DeepSeek-V3.2-Exp 模型的适配工作,最大可支持160K长序列上 下文长度。目前,该模型已正式上架华为云大模型即服务平台 MaaS。 目前,该模型已正式上架华为云大模型即服务平台 MaaS。 ...