DeepSeek-V3.2上线国家超算互联网 开发者可免费下载
模型发布与技术进展 - DeepSeek于9月29日正式发布实验性模型DeepSeek-V3.2-Exp [1] - 新模型在V3.1-Terminus基础上引入DeepSeekSparseAttention稀疏注意力机制 [1] - 该技术针对长文本训练和推理效率进行探索性优化验证 [1] - DeepSeekSparseAttention首次实现细粒度稀疏注意力机制 [1] - 新技术在几乎不影响模型输出效果前提下大幅提升长文本训练和推理效率 [1] 平台接入与开发者服务 - DeepSeek-V3.2-Exp于9月30日上线国家超算互联网AI社区 [1] - 模型依托国产深算智能加速卡及全国一体化算力网运行 [1] - 企业和开发者均可在AI社区免费下载模型文件进行快速开发 [1] - 超算互联网AI社区已汇聚700余款国内外优质开源模型 [2] - 平台提供API调用、Chatbot在线推理对话、国产大模型分布式训练及微调等MaaS服务 [2]