Workflow
DeepSeek,新版本
中国证券报·2025-09-29 12:39

DeepSeek-V3.2-Exp模型发布 - 9月29日DeepSeek发布实验性版本DeepSeek-V3.2-Exp 在V3.1-Terminus基础上引入稀疏注意力机制以优化长文本训练和推理效率 [1] - 新模型服务成本大幅降低使API价格下调超过50% 所有终端平台同步更新 [1] - 华为昇腾实现0day支持并开源推理代码 在128K长序列下保持TTFT低于2秒和TPOT低于30毫秒的推理性能 [3] 寒武纪适配与优化进展 - 寒武纪同步适配DeepSeek-V3.2-Exp并开源vLLM-MLU推理引擎源代码 支持开发者在其软硬件平台体验新模型 [1] - 通过Triton算子开发和BangC融合算子实现快速适配与性能优化 达成业界领先计算效率水平 [2] - 长期支持主流开源大模型生态 此前对DeepSeek系列已实现业界领先算力利用率 [2] 华为昇腾技术部署 - 基于vLLM/SGLang推理框架完成适配部署 开源所有推理代码和算子实现 [3] - 在CANN平台完成BF16模型优化适配 采用大EP并行方案与CP并行策略兼顾时延和吞吐 [3] DeepSeek模型迭代历程 - 8月21日发布DeepSeek-V3.1 9月22日升级至Terminus版本 改进语言一致性问题并缓解中英文混杂及异常字符情况 [3]