DeepSeek,重大突发!
券商中国·2025-09-29 11:16

DeepSeek-V3.2-Exp模型发布 - 公司于9月29日正式发布DeepSeek-V3.2-Exp模型并在Hugging Face平台开源[2][3] - 新模型引入自研DeepSeek Sparse Attention稀疏注意力机制旨在优化长文本训练和推理效率[3][5] - 模型在各大公开评测集表现与V3.1-Terminus基本持平有效性得到初步验证[8] 技术特性与产业合作 - DeepSeek Sparse Attention技术实现细粒度稀疏注意力机制大幅提升长文本场景效率几乎不影响输出效果[5] - 华为云已完成模型适配工作最大支持160K长序列上下文长度[4] - 寒武纪同步实现模型适配并开源大模型推理引擎vLLM-MLU源代码[4] 商业化与开源策略 - 得益于服务成本降低官方API价格下调开发者调用成本降低50%以上[1][9] - 新价格政策下输入缓存命中时0.2元/百万tokens未命中时2元/百万tokens输出为3元/百万tokens[9] - 公司在Huggingface和ModelScope平台全面开源模型并为V3.1-Terminus保留API接口至2025年10月15日[11] 行业竞争动态 - 在DeepSeek-V3.2发布前夕智谱GLM-4.6即将发布并提示带来更大上下文[15][16] - 智谱Z.ai官网已将GLM-4.5标识为上一代旗舰模型[1][17] - 智谱GLM-4.5在41个公开视觉多模态榜单达同级别开源模型SOTA性能BFCL v4基准全球第一成本仅为Claude Opus 4.1的1.5%[18]