Workflow
DeepSeek新模型正式发布!寒武纪已实现适配

模型发布与技术升级 - DeepSeek于9月29日正式发布DeepSeek-V3.2-Exp模型,该模型在V3.1-Terminus基础上引入DeepSeek Sparse Attention稀疏注意力机制,针对长文本训练和推理效率进行探索性优化和验证[1] - 9月22日晚DeepSeek线上模型升级至DeepSeek-V3.1-Terminus版本,8月21日发布的DeepSeek-V3.1实现混合推理架构,同时支持思考模式与非思考模式,具备更高思考效率和更强Agent能力[2] - DeepSeek-V3.1使用UE8M0 FP8参数精度,专门针对即将发布的下一代国产芯片设计[2] 产品服务与市场策略 - DeepSeek官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp,同时API大幅度降价,新价格政策下开发者调用DeepSeek API成本将降低50%以上[1] - 9月29日更早时候,DeepSeek在开源社区平台Huggingface上架DeepSeep V3.2-base页面但很快删除[1] 行业合作与生态建设 - 寒武纪于9月29日晚宣布已同步实现对DeepSeek-V3.2-Exp模型的适配,并开源大模型推理引擎vLLM-MLU源代码,开发者可在寒武纪软硬件平台体验新模型[1] - 智谱新模型GLM-4.6也将于近日发布,目前已可通过API接口调用[1] 市场反应与行业影响 - DeepSeek-V3.1使用UE8M0 FP8参数精度消息公布后,当日DeepSeek概念板块火热,不少国产芯片产业链企业股价大涨[2]