华为昇腾、寒武纪宣布适配DeepSeek最新模型

模型发布与核心技术创新 - 公司于9月29日正式发布DeepSeek-V3.2-Exp模型，该模型是在V3.1-Terminus基础上的探索性版本 [1] - 新模型首次引入自研的DeepSeek Sparse Attention稀疏注意力机制，旨在优化长文本的训练和推理效率 [1] - DSA机制能够自适应选择关键注意力头与局部上下文窗口，相比传统稠密注意力机制，在处理长文本时计算量呈指数级增长的问题得到解决，方案更高效且成本更低 [7][1] 性能表现与成本优势 - 通过引入DSA机制，V3.2-Exp实现了长文本训练和推理效率的大幅提升，同时在各项核心能力上与V3.1-Terminus保持基本持平 [7] - 得益于新模型服务成本大幅降低，DeepSeek API价格下调50%以上，显著降低了开发者的调用成本 [2][10] 开源策略与生态协同 - 公司将DeepSeek-V3.2-Exp模型在Huggingface和ModelScope平台上全面开源，相关论文也已同步公开 [5] - 新模型发布后，华为昇腾、寒武纪和海光信息第一时间宣布完成适配，显示出国产AI软硬件生态的协同发展 [11] - 公司开源了TileLang版本算子，该国产编程语言由北京大学团队开发，能将FlashAttention算子代码量从超500行减少至80行并保持性能，显著提升AI算子开发效率 [11][3] 版本状态与行业影响 - DeepSeek-V3.2-Exp定位为实验版本，公司认识到新模型仍需在更广泛用户真实场景中进行大规模测试 [4] - 公司为方便用户对比测试，为V3.1-Terminus临时保留额外API访问接口至10月15日，调用价格与V3.2-Exp一致 [4] - 华为计算宣布昇腾已实现DeepSeek-V3.2-Exp 0day支持，并面向开发者开源所有推理代码和算子实现，表明国产模型、编程语言与算力正深度协同共进 [12]