DeepSeek Sparse Attention (DSA)

搜索文档
DeepSeek V3.2 发布:长文本能力新突破,API 价格砍半
Founder Park· 2025-09-29 10:55
DeepSeek-V3.2 来了! DeepSeek 正式推出其最新的实验性模型 DeepSeek-V3.2-Exp 。这是一个实验性( Exp erimental)的版本,该版本在 V3.1-Terminus 的基础上,引入 了革命性的 DeepSeek Sparse Attention (DSA) 技术,旨在大幅提升长文本处理的效率。 目前,官方 App、网页端、小程序均已同步更新为 DeepSeek-V3.2-Exp。 与此同时,官方宣布 API 服务价格 下调超过 50% 。 核心亮点一览: 以下内容要点来自官方文章。 超 14000 人的「AI 产品市集」社群!不错过每一款有价值的 AI 应用。 DeepSeek Sparse Attention (DSA) DeepSeek Sparse Attention (DSA) 首次实现了细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大 幅提升。 1. 技术革新 :首创 DeepSeek 稀疏注意力(DSA) 机制,在几乎不影响模型性能的前提下,显著提升了长文本的训练和推理速度。 2. 成本骤降 :得益于效率提升,AP ...
DeepSeek新模型上线!引入DSA新稀疏注意力,还又狙了CUDA一枪
量子位· 2025-09-29 10:44
编辑部 发自 凹非寺 量子位 | 公众号 QbitAI 刚发V3.1"最终版",DeepSeek最新模型又来了! DeepSeek-V3.2-Exp 刚刚官宣上线,不仅引入了新的注意力机制—— DeepSeek Sparse Attention 。 还开源了更高效的TileLang版本GPU算子 ! DeepSeek-V3.2-Exp基于上周刚更新的DeepSeek-V3.1-Terminus打造,核心创新是引入了 DeepSeek Sparse Attention(DSA)稀疏注 意力机制 。 DSA 首次 实现了 细粒度注意力机制 ,能在几乎不影响模型输出效果的前提下,实现长文本和推理效率大幅提升。 目前,官方App、网页端、小程序均已同步更新,同时还有 API大减价:5折起 。 这波DeepSeek国庆大礼包,属实有点惊喜了。 新注意力机制 V3.1-Terminus是在 DeepSeek-V3.1基础上的一个 强化版本 ,在稳定性、工具调用能力、语言一致性、错误修正等方面进行迭代改进。 与前不久更新的DeepSeek-V3.1-Terminus对比,在各领域公开测评集上,DeepSeek-V3.2-E ...