Workflow
Seek .(SKLTY)
icon
搜索文档
“价格屠夫”DeepSeek上线,新模型成本下降超50%
第一财经· 2025-09-29 11:50
模型发布与定价策略 - 公司正式发布DeepSeek-V3.2-Exp模型,调用价格大幅降低,输出价格大降75%[1] - 在新价格政策下,开发者调用API的成本将降低50%以上[1] - 具体价格变动:输入价格在缓存命中时从0.5元/百万tokens降至0.2元/百万tokens,缓存未命中时从4元/百万tokens降为2元/百万tokens;输出价格从12元/百万tokens直接降至3元/百万tokens[3] 技术优化与性能表现 - V3.2-Exp作为实验性版本引入DeepSeek Sparse Attention稀疏注意力机制,针对长文本训练和推理效率进行探索性优化和验证[3] - 通过细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下实现长文本训练和推理效率的大幅提升[3] - 在各领域公开评测集上,DeepSeek-V3.2-Exp的表现与V3.1-Terminus基本持平,其中MMLU-Pro得分85.0,GPQA-Diamond得分80.7,Humanity's Last Exam得分21.7[4][5] 模型部署与开源支持 - 模型已在Huggingface与魔搭平台开源,官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp[5] - API模型版本已更新为DeepSeek-V3.2-Exp,访问方式保持不变[5] - 为支持社区研究,公司开源新模型研究中设计和实现的GPU算子,包括TileLang和CUDA两种版本,建议研究性实验优先使用基于TileLang的版本以便调试和快速迭代[6] 版本迭代与市场预期 - 此次发布距离9月22日发布的V3.1-Terminus模型仅一周时间,打破了业界对V3系列迎来终极版本的猜测[6] - 公司在年初出圈后每次更新都受业界瞩目,但近期几次更新均为小版本迭代,市场对V4和R2版本的呼声越来越高[6] - 结合此次发布情况,市场预期近期不会看到V4和R2版本的重大更新[6]
DeepSeek V3.2和智谱GLM-4.6即将发布
证券日报网· 2025-09-29 11:46
公司动态 - DeepSeek在Huggingface平台上架了其DeepSeek-V3.2-base模型 [1] - 智谱的新一代旗舰模型GLM-4-6即将发布 [1] - 在Zai官网上GLM-4-5已被标识为上一代旗舰模型 [1]
DeepSeek-V3.2-Exp模型正式发布并开源 官方大幅下调API价格
智通财经网· 2025-09-29 10:53
模型发布与技术更新 - 深度求索公司于9月29日正式发布实验性模型DeepSeek-V3.2-Exp [1] - 新模型在V3.1-Terminus基础上引入稀疏注意力架构DeepSeek Sparse Attention (DSA),旨在优化长文本训练和推理效率 [1] - DSA首次实现细粒度稀疏注意力机制,在几乎不影响模型输出效果的前提下大幅提升长文本处理效率 [1] 模型性能与评估 - DeepSeek-V3.2-Exp的训练设置与V3.1-Terminus严格对齐,在各领域公开评测集上表现基本持平 [2] - 稀疏注意力机制的引入经过严谨评估,确保了模型性能的稳定性 [2] 产品部署与可用性 - 官方App、网页端和小程序均已同步更新为DeepSeek-V3.2-Exp模型 [1] - 该模型已正式上架华为云大模型即服务平台MaaS [1] - 华为云采用大EP并行方案部署,基于稀疏注意力结构叠加实现长序列亲和的上下文并行策略 [1] 定价策略与成本优化 - 官方API价格大幅下调,新价格即刻生效 [2] - 得益于新模型服务成本降低,开发者调用DeepSeek API的成本将降低50%以上 [2]
DeepSeek新模型上线华为云
第一财经· 2025-09-29 10:51
华为云平台动态 - 华为云已完成对DeepSeek-V3.2-Exp模型的适配工作 [1] - 该模型最大可支持160K长序列上下文长度 [1] - 模型已正式上架华为云大模型即服务平台MaaS [1]
DeepSeek-V3.2-Exp正式发布 API大幅降价
证券时报网· 2025-09-29 10:29
产品发布 - 公司正式发布DeepSeek-V3.2-Exp模型 [1] - 官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp [1] 定价策略 - API价格大幅下调 [1] - 新价格政策下开发者调用API成本降低50%以上 [1]
DeepSeek-V3.2-Exp 发布,训练推理提效,API成本降50%以上
新浪科技· 2025-09-29 10:27
模型发布与更新 - 公司发布DeepSeek-V3-2-Exp模型,这是一个实验性版本,作为迈向新一代架构的中间步骤 [1] - 新模型在V3-1-Terminus基础上引入DeepSeek Sparse Attention稀疏注意力机制,针对长文本训练和推理效率进行探索性优化和验证 [1] - 官方App、网页端、小程序均已同步更新为DeepSeek-V3-2-Exp模型 [1] 商业策略与定价 - API大幅度降价,在新的价格政策下,开发者调用DeepSeek API的成本将降低50%以上 [1] - DeepSeek-V3-2-Exp模型现已在Huggingface与魔搭开源 [1] 模型性能表现 - 在各领域公开评测集上,DeepSeek-V3-2-Exp的表现与V3-1-Terminus基本持平 [1]
DeepSeek V3.2要来了?
观察者网· 2025-09-29 09:58
公司产品发布动态 - 开源社区平台Hugging Face上出现DeepSeek-V3 2页面引发关注 [1] - DeepSeek最新一次更新在一周前的9月22日发布DeepSeek-V3 1-Terminus模型并宣布开源 [3] - 目前Hugging Face相关界面显示报错公司官方尚未对此回应 [4] 公司产品发布历史规律 - DeepSeek有在节前一天发布新版本和更新的历史 [2] - 2024年12月27日(元旦前)发布DeepSeek V3 [3] - 2025年5月28日(端午节前)发布DeepSeek-R1-0528称为端午节特别献礼 [3]
DeepSeek V3.2、GLM4.6等大模型即将发布
证券时报网· 2025-09-29 09:04
大模型技术迭代动态 - DeepSeek-V3 2版本即将发布 v3 2-base模型文件已上传至HuggingFace官方页面但目前已下线 [1] - 智谱GLM4 6版本也即将发布 官方提示新版本将带来更大的上下文支持 [1]
国庆前发布?DeepSeek V3.2惊现HuggingFace
华尔街见闻· 2025-09-29 09:03
模型发布动态 - 据网友发现,DeepSeek已将v3.2-base模型上传至其HuggingFace官方页面 [1] - 模型文件目前正处于上传过程中 [1] - 该模型页面目前已下线 [1]
DeepSeek与智谱将发布新模型
第一财经· 2025-09-29 08:58
模型发布动态 - DeepSeek-V3 2新模型于9月29日被上传至社区平台HuggingFace 随后被删除 [1] - 智谱新模型GLM-4 6将于近日发布 目前已可通过API接口调用 [1]