Workflow
寒武纪、华为昇腾适配DeepSeek最新模型
财联社·2025-09-30 00:59

9月29日,DeepSeek-V3.2-Exp模型正式在Hugging Face平台发布并开源。模型引入稀疏 Attention 架构,这种架构能够降低计算资源消耗并提升模型 推理效率。 海光信息同日宣布其DCU实现无缝适配+深度调优,做到大模型算力"零等待"部署。 海光信息表示,基于GPGPU架构强大的生态优势,与编程开发 软件栈DTK的特性,DeepSeek-V3.2-Exp在海光DCU上展现出优异的性能,同时验证海光DCU高通用性、高生态兼容度及自主可控的技术优势。 据"华为计算"微信公众号消息, 昇腾已快速基于vLLM/SGLang等推理框架完成适配部署,实现DeepSeek-V3.2-Exp 0day支持 ,并面向开发者开源 所有推理代码和算子实现。 寒武纪在官方微信号宣布, 已同步实现对深度求索公司最新模型DeepSeek-V3.2-Exp的适配,并开源大模型推理引擎vLLM-MLU源代码。 依托 DeepSeek-V3.2-Exp带来的全新DeepSeek Sparse Attention机制,叠加寒武纪的极致计算效率,可大幅降低长序列场景下的训推成本。 ...