寒武纪(688256)

搜索文档
DeepSeek新版本API价格下调寒武纪:对新模型DeepSeek
新浪财经· 2025-09-30 01:38
9月29日,DeepSeek发布DeepSeek-V3.2-Exp模型版本。据介绍,这是一个实验性(Experimental)版本,在此前版本V3.1-Terminus的基础上引入DeepSeek Sparse Attention 记者注意到,9月29日晚,寒武纪在"寒武纪开发者"公众号发文称,公司已同步实现对深度求索公司最新模型DeepSeek-V3.2-Exp的适配,并开源大模型推理引擎vLLM-MLU源代码。开发者可 寒武纪表示,公司一直高度重视大模型软件生态建设,支持以DeepSeek为代表的所有主流开源大模型。借助于长期活跃的生态建设和技术积累,寒武纪得以快速实现对DeepSeek-V3.2-Exp这 "华为计算"公众号发文称,昇腾已快速基于vLLM/SGLang等推理框架完成适配部署,实现DeepSeek-V3.2-Exp 0day支持,并面向开发者开源所有推理代码和算子实现。华为昇腾在DeepSe 近日,DeepSeek持续推进模型迭代。8月21日,DeepSeek宣布发布DeepSeek-V3.1。一个月后,9月22日,DeepSeek宣布DeepSeek-V3.1已更新至DeepSeek-V ...
科创50增强ETF(588460)开盘涨0.87%,重仓股海光信息涨1.82%,中芯国际涨1.82%
新浪财经· 2025-09-30 01:38
来源:新浪基金∞工作室 9月30日,科创50增强ETF(588460)开盘涨0.87%,报1.741元。科创50增强ETF(588460)重仓股方 面,海光信息开盘涨1.82%,中芯国际涨1.82%,寒武纪涨4.87%,澜起科技涨1.50%,金山办公涨 1.95%,思特威涨0.63%,中微公司跌0.98%,恒玄科技跌0.50%,华海清科跌1.11%,九号公司涨 0.06%。 科创50增强ETF(588460)业绩比较基准为上证科创板50成份指数收益率,管理人为鹏华基金管理有限 公司,基金经理为苏俊杰,成立(2022-12-01)以来回报为73.26%,近一个月回报为9.70%。 风险提示:市场有风险,投资需谨慎。本文为AI大模型自动发布,任何在本文出现的信息(包括但不 限于个股、评论、预测、图表、指标、理论、任何形式的表述等)均只作为参考,不构成个人投资建 议。 ...
国产AI重磅!DeepSeek-V3.2发布!寒武纪、昇腾均已适配!国产芯片深度协同有望受益
新浪基金· 2025-09-30 01:30
9月29日晚间,DeepSeek宣布,正式发布 DeepSeek-V3.2-Exp模型。模型引入稀疏 Attention 架构,这种 架构能够降低计算资源消耗并提升模型推理效率。在新的价格政策下,开发者调用DeepSeek API的成本 将降低50%以上。 仅4分钟后,寒武纪表示,已同步实现对DeepSeek-V3.2-Exp的适配,并开源大模型推理引擎vLLM- MLU源代码。在业内人士看来,此种同步发布适配的动作,表明中国AI产业链头部公司正在进行深度 协同。 市场分析人士指出,DeepSeek-V3.2发布当天,寒武纪与昇腾均已实现适配。DeepSeek-V3.2最大的意义 在于软硬协同设计支持国产算力,全新DeepSeek Sparse Attention机制,叠加国产芯片的计算效率,可大 幅降低长序列场景下的训推成本,共同为客户提供极具竞争力的软硬件解决方案。day 0适配和优化彰 显了国产芯片的生态建设和技术积累成果,芯片和算法的联合创新,软硬件协同方式将进一步加速国内 AI产业发展。 申港证券认为,随着算力基础设施的持续投入,国产算力在模型侧和算力芯片方面或将持续突破,有望 维持较好景气度,展望 ...
罕见!两大AI巨头DeepSeek、寒武纪同步重磅发布,有何影响
中国基金报· 2025-09-30 01:13
DeepSeek-V3 2-Exp模型发布 - DeepSeek于2025年9月29日正式发布DeepSeek-V3 2-Exp实验性模型[1] - 新模型在V3 1-Terminus基础上引入DeepSeek Sparse Attention稀疏注意力机制[1] - 模型针对长文本训练和推理效率进行探索性优化和验证[1] - 官方App、网页端、小程序均已同步更新为DeepSeek-V3 2-Exp版本[1] - API价格大幅降价,开发者调用成本降低50%以上[1][2] 寒武纪技术适配与生态支持 - 寒武纪在DeepSeek发布后4分钟即宣布完成对DeepSeek-V3 2-Exp的day 0适配[2][3] - 公司同步开源大模型推理引擎vLLM-MLU源代码[3][5] - 寒武纪高度重视大模型软件生态建设,支持所有主流开源大模型[5][6] - 通过长期生态建设和技术积累实现快速适配和优化[5][6] 技术优化与性能提升 - 寒武纪对DeepSeek系列模型进行深入软硬件协同性能优化[6] - 通过Triton算子开发实现快速适配,利用BangC融合算子开发实现极致性能优化[6] - 基于计算与通信的并行策略达成业界领先的计算效率水平[6] - DeepSeek Sparse Attention机制叠加寒武纪计算效率可大幅降低长序列场景训推成本[6] 产业链协同趋势 - 同步发布适配表明中国AI产业链头部公司进行深度协同[7] - 可能在DeepSeek-V3 2发布前寒武纪就与DeepSeek进行技术沟通并启动适配研发[7]
海外投资者聚焦中国科技 布局中国的新利器ETF CNQQ已在纳斯达克上市
搜狐财经· 2025-09-30 00:39
摘要 【海外投资者聚焦中国科技 布局中国的新利器ETF CNQQ已在纳斯达克上市】9月26日,布局中国科技的ETF CNQQ于纳斯达克上市。该ETF由美国投资 机构锐联投资研究(Rayliant Investment Research)发行,以Solactive ChinaAMC Transformative China Tech Index(Solactive华夏转型中国科技指数)为底 层指数。该指数由Solactive AG与华夏基金合作开发。Solactive AG是德国的一家指数公司,以运作灵活、擅长与客户合作开发创新型指数产品闻名。 【导读】布局中国科技的ETF CNQQ9月26日于上市 9月26日,布局中国科技的ETF CNQQ于纳斯达克上市。该ETF由美国投资机构锐联投资研究(Rayliant Investment Research)发行,以Solactive ChinaAMC Transformative China Tech Index(Solactive华夏转型中国科技指数)为底层指数。 该指数由Solactive AG与华夏基金合作开发。Solactive AG是德国的一家指数公司,以运 ...
DeepSeek新版本API价格下调 寒武纪:对新模型DeepSeek
中国证券报· 2025-09-30 00:09
模型更新与性能优化 - DeepSeek发布实验性版本DeepSeek-V3.2-Exp 引入稀疏注意力机制以提升长文本训练和推理效率 [1] - 新模型服务成本大幅降低 API价格下调超过50% [1] - DeepSeek-V3.2-Exp已在App、网页端和小程序同步更新 [1] 硬件厂商适配与生态支持 - 寒武纪同步适配DeepSeek-V3.2-Exp并开源大模型推理引擎vLLM-MLU源代码 [1] - 寒武纪通过Triton算子开发和BangC融合算子实现快速适配及性能优化 达成业界领先计算效率水平 [2] - 华为昇腾基于vLLM/SGLang推理框架完成DeepSeek-V3.2-Exp的0day支持 并开源所有推理代码和算子实现 [3] - 华为昇腾在CANN平台完成优化适配 在128K长序列下实现TTFT低于2秒、TPOT低于30毫秒的推理性能 [3] 模型迭代历程 - DeepSeek于8月21日发布V3.1版本 并于9月22日更新至Terminus版本 改进语言一致性问题 [3] - Terminus版本针对用户反馈优化 缓解中英文混杂及异常字符情况 [3]
财经早报:事关新型政策性金融工具、人工智能发展等,国家发改委最新回应丨2025年9月30日
新浪证券· 2025-09-29 23:24
【跟踪牛人动态】超3000名"专业选手"如何调仓?最牛选手单只标的浮盈超300% 【头条要闻】 事关新型政策性金融工具、人工智能发展等,国家发改委最新回应 9月29日,国家发展改革委召开9月份新闻发布会。国家发展改革委将深入贯彻落实党中央、国务院决策 部署,持续发力、适时加力实施宏观政策。同时,国家发展改革委将持续加强经济监测预测预警,做好 政策预研储备,根据形势变化及时推出。随着各项政策效应充分释放,我们有信心继续保持经济平稳健 康发展,有信心实现全年目标任务。 为贯彻落实党中央、国务院决策部署,促进金融更好服务实体经济,推动扩大有效投资,会同有关方面 积极推进新型政策性金融工具有关工作。新型政策性金融工具规模共5000亿元,全部用于补充项目资本 金。 商务部回应美发布出口管制穿透性规则:将采取必要措施 商务部网站消息,商务部新闻发言人就美商务部发布出口管制穿透性规则事答记者问。 有记者问:美东时间2025年9月29日,美商务部发布出口管制穿透性规则,对被列入美"实体清单"等的 企业持股超过50%的子公司追加同等出口管制制裁。请问中方对此有何评论? 答:中方注意到有关情况。相关规则是美方泛化国家安全、滥用出 ...
罕见!DeepSeek、寒武纪同步重磅发布
中国基金报· 2025-09-29 15:59
【导读】DeepSeek、寒武纪同步发布相关重要事项 中国基金报记者 卢鸰 国内两大AI巨头DeepSeek(深度求索)、寒武纪罕见同步发布相关重要事项。 DeepSeek官方微信号9月29日18:07发文称,"今天,我们正式发布 DeepSeek-V3.2-Exp模型,这是一个实验性(Experimental)的版本。作为迈向新一代架 构的中间步骤,V3.2-Exp在V3.1-Terminus的基础上引入了DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性 的优化和验证。目前,官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp,同时API大幅度降价,欢迎广大用户体验测试并向我们反馈意 见。" DeepSeek表示,"在新的价格政策下,开发者调用DeepSeek API的成本将降低50%以上。目前API的模型版本为DeepSeek-V3.2-Exp,访问方式保持不变。" 仅仅4分钟后,即18:11,寒武纪旗下的微信公众号"寒武纪开发者"发布文章称:"2025年9月29日,寒武纪已同步实现对深度求索公司最新模型DeepSeek ...
罕见!DeepSeek、寒武纪同步重磅发布
中国基金报· 2025-09-29 15:57
DeepSeek-V3.2-Exp模型发布 - 公司于9月29日正式发布实验性模型DeepSeek-V3.2-Exp 作为迈向新一代架构的中间步骤 [2] - 新模型在V3.1-Terminus基础上引入DeepSeek Sparse Attention稀疏注意力机制 针对长文本训练和推理效率进行探索性优化和验证 [2] - 官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp模型 [2] API价格调整 - API模型版本更新为DeepSeek-V3.2-Exp 访问方式保持不变 [4] - 在新的价格政策下 开发者调用DeepSeek API的成本将降低50%以上 [4] 寒武纪生态适配 - 寒武纪于同日同步实现对DeepSeek-V3.2-Exp模型的适配 并开源大模型推理引擎vLLM-MLU源代码 [4] - 公司高度重视大模型软件生态建设 支持以DeepSeek为代表的所有主流开源大模型 [6] - 通过长期活跃的生态建设和技术积累 实现了对新模型架构的day 0适配和优化 [6] 技术协同与优化 - 寒武纪重视芯片和算法联合创新 以软硬件协同方式优化大模型部署性能并降低部署成本 [6] - 针对新模型架构通过Triton算子开发实现快速适配 利用BangC融合算子开发实现极致性能优化 [6] - 基于计算与通信的并行策略 再次达成业界领先的计算效率水平 [6] 产业链协同意义 - 同步发布适配动作表明中国AI产业链头部公司正在进行深度协同 [7] - 可能早在模型发布之前 寒武纪就在技术方面与DeepSeek进行沟通并启动相关适配研发工作 [7] - DeepSeek Sparse Attention机制叠加寒武纪的极致计算效率 可大幅降低长序列场景下的训推成本 [6]
罕见!DeepSeek、寒武纪同步发布相关重要事项
中国基金报· 2025-09-29 15:55
DeepSeek-V3.2-Exp模型发布 - 公司于9月29日18:07正式发布DeepSeek-V3.2-Exp实验性模型,该模型在V3.1-Terminus基础上引入DeepSeek Sparse Attention稀疏注意力机制,针对长文本训练和推理效率进行探索性优化和验证 [2] - 官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp模型,同时API价格大幅降低,欢迎用户体验测试并提供反馈意见 [2] - 在新价格政策下,开发者调用DeepSeek API的成本将降低50%以上,目前API模型版本为DeepSeek-V3.2-Exp,访问方式保持不变 [3] 寒武纪技术适配与生态支持 - 寒武纪于9月29日18:11同步实现对DeepSeek-V3.2-Exp模型的适配,并开源大模型推理引擎vLLM-MLU源代码,开发者可在寒武纪软硬件平台第一时间体验新模型亮点 [3][4] - 公司高度重视大模型软件生态建设,支持以DeepSeek为代表的所有主流开源大模型,借助长期活跃的生态建设和技术积累,实现对新模型架构的day 0适配和优化 [4][5] - 寒武纪通过Triton算子开发实现快速适配,利用BangC融合算子开发实现极致性能优化,基于计算与通信并行策略达成业界领先计算效率水平 [6] 产业链协同与性能优化 - 寒武纪对DeepSeek系列模型进行深入软硬件协同性能优化,达成业界领先算力利用率水平 [6] - 依托DeepSeek-V3.2-Exp的DeepSeek Sparse Attention机制叠加寒武纪极致计算效率,可大幅降低长序列场景下训推成本,共同为客户提供极具竞争力软硬件解决方案 [6] - 同步发布适配动作表明中国AI产业链头部公司进行深度协同,可能早在模型发布前寒武纪就在技术方面与DeepSeek沟通并启动相关适配研发工作 [6]