Workflow
Seek .(SKLTY)
icon
搜索文档
PPIO首发上线DeepSeek-V3.2-Exp
证券日报网· 2025-09-30 06:17
模型技术更新 - DeepSeek发布新版本模型DeepSeek-V3-2-Exp 该模型在V3-1-Terminus基础上引入DeepSeek稀疏注意力机制 旨在优化长上下文场景下的训练和推理效率 [1] - 新模型架构在提升训练推理效率的同时 实现了API价格的大幅下降 [1] 产品定价与成本 - PPIO平台对DeepSeek-V3-2-Exp的定价为每百万输入tokens 2元 每百万输出tokens 3元 [1] - 新定价使开发者调用DeepSeek API的成本降低75% [1] 平台服务能力 - PPIO是致力于为企业及开发者提供高性能API的服务平台 拥有丰富的开源模型"超市" [2] - 平台已上线DeepSeek R1/V3、DeepSeek-Prover-V2-671B、MiniMax、Qwen等系列模型 支持仅需一行代码即可调用 [2] - 根据《2025大模型服务性能排行榜》 PPIO在DeepSeek-R1-0528的吞吐测试中排名第一 [2] - 公司通过2024年实践 已实现大模型推理的10倍以上降本 达成推理效率与资源使用的动态平衡 [2]
国产算力适配DeepSeek新模型,AI概念股集体拉升
21世纪经济报道· 2025-09-30 03:44
AI概念股市场表现 - 9月30日早盘AI相关概念股集体拉升,主要分为AI语料和半导体硬件两个方向 [1] - AI语料方向整体上涨2.10%至1353.894点,当虹科技20CM涨停,开普云涨9.72%,拓尔思涨6.51%,值得买涨6.49% [1][2] - 半导体硬件方向整体上涨1.45%至12404.781点,德明利涨停,江波龙涨9.38%,联芸科技涨7.94%,寒武纪等跟涨 [1][3] 关键公司股价变动 - 当虹科技最新价61.32元,涨幅20.00% [2] - 开普云最新价213.85元,涨幅9.72% [2] - 拓尔思最新价22.59元,涨幅6.51% [2] - 德明利最新价204.69元,涨幅10.00% [3] - 江波龙最新价162.28元,涨幅9.38% [3] - 寒武纪-U最新价1370.72元,涨幅3.57% [4] 行业催化剂 - DeepSeek于9月29日晚宣布官方App、网页端、小程序同步更新为DeepSeek-V3.2-Exp,API价格下调使开发者调用成本降低50%以上 [4] - 多家国产芯片厂商宣布完成对DeepSeek-V3.2-Exp的适配,包括寒武纪开源大模型推理引擎vLLM-MLU源代码 [5] - 华为昇腾实现DeepSeek-V3.2-Exp 0day支持并开源推理代码,海光信息宣布该模型在海光DCU上展现优异性能 [5] 机构观点 - 华鑫证券认为国产AI芯片大时代来临,产业链从上游先进制程到下游模型加速迭代已实现全产业链打通 [5] - 中银证券分析AI应用商业化拐点临近,应用端商业化加速催化算力需求,国产算力迎来重要产业突破 [5] - 中信证券预计2025Q3计算机板块收入稳健增长,算力方向保持高景气度,应用领域拐点已至 [6]
DeepSeek发新模型;库克确认持有加密货币丨科技风向标
21世纪经济报道· 2025-09-30 03:07
AI大模型行业动态 - DeepSeek发布V3 2 Exp模型并同步更新官方应用 API调用成本降低50%以上 [2] - 华为云和寒武纪已完成对DeepSeek-V3 2-Exp模型的适配工作 [2] - 智谱新模型GLM-4 6预计近日发布 目前已可通过API接口调用 [2] - 阿里通义7款模型入选Hugging Face全球前十开源模型榜单 其中Qwen3-Omni登顶 [5] - 阿里通义Qwen3-Omni为全模态大模型 音视频能力获32项开源最佳性能SOTA 可处理文本图片语音视频四种数据 [5] - 阿里通义共开源300多个模型 全球下载量突破6亿次 衍生模型超17万个 位居全球第一 [5] - 寒武纪实现对DeepSeek-V3 2-Exp的适配并开源大模型推理引擎vLLM-MLU源代码 [12] - 华为昇腾基于vLLM/SGLang等推理框架完成DeepSeek-V3 2-Exp适配部署 实现0day支持并开源推理代码和算子实现 [13] 科技巨头战略动向 - 苹果CEO库克确认个人持有比特币和以太币等加密货币 但表示苹果公司不会接受加密货币支付或投资加密货币 [3] - 华为任命余承东为公司产品投资评审委员会主任 其仍担任常务董事和终端BG董事长 掌管终端和鸿蒙智行业务 [6] - 小米集团表示小米17系列没有削减订单计划 因新增标准版16GB+1TB版本及Pro系列加单 整体订单较上一代增加 [8][9] - 美团无人机在深圳上线夜间配送服务 为国内首次将无人机融入夜间即时零售场景 平均配送时长约15分钟效率提升近100% [19] - 美团无人机自2021年常态化运营以来累计完成超60万单外卖配送 夜间服务将率先覆盖深圳公园等夜间热点区域 [19] - OpenAI在ChatGPT中推出家长控制功能 允许家长关联青少年账户并进行自定义设置 [20] 企业合作与资本运作 - 赛力斯全资子公司支付完毕115亿元对价 收购华为持有的引望智能10%股权 [4] - 赛力斯公布2025年半年度利润分配预案 每10股派现3 10元 合计派发现金红利5 06亿元 占上半年归母净利润17 22% [14] - 赛力斯上半年归母净利润29 41亿元 同比增长81 03% 问界汽车上半年累计交付超14 7万辆 [14] - 宁德时代与海口市龙华区政府签约 计划至2030年在海南投资建设100座换电站 实现核心城区10分钟找站 [10] - 斯年智驾完成数亿元B+轮融资 资金将用于无人驾驶产品研发和市场开拓 [16] - 灵猴机器人完成超亿元A轮融资 资金将用于工业自动化及机器人核心零部件研发实验室建设和产能扩充 [17][18] 政策与行业标准 - 国家税务总局重申平台企业不得转嫁涉税义务 将严查向外卖员快递员等变相收费行为 [7] - 税务部门明确月收入低于6250元的从业人员无需预扣税款以保护其合法权益 [7] - 我国发布首项个人信息跨境安全管理国家标准《数据安全技术个人信息跨境处理活动安全认证要求》 将于2026年3月1日实施 [11] 上市公司业绩 - 英联股份预计2025年前三季度归母净利润3450万元至3750万元 同比增长1531 13%至1672 97% [15] - 英联股份业绩增长主要得益于快消品金属包装易开盖板块贡献 市场占有率提升及降本增效 [15] - 公司复合集流体项目已进入规模化应用关键时期 [15]
DeepSeek突然拥抱国产GPU语言,TileLang对标CUDA替代Triton,华为昇腾Day0官宣支持适配
36氪· 2025-09-30 02:52
TileLang技术特性 - TileLang是一种专门用于开发GPU内核的领域专用语言,性能可对标英伟达CUDA,采用Python式语法并在TVM之上构建编译器基础架构[4][13] - 其核心设计理念是将调度空间与数据流解耦并封装为可自定义的注解和原语,以Tile作为编程模型核心概念,直观控制数据在全局内存、共享内存和寄存器间的流动[15] - 提供三个层次编程接口:硬件无关的高层接口供初学者使用,包含预定义优化操作的Tile Library供有经验开发者使用,以及允许直接操作线程同步等底层特性的线程原语供专家用户使用[15] 性能优势与效率提升 - 使用TileLang只需不到100行代码就能写出比Flash Attention 2原版快30%的注意力实现[3] - 在FlashAttention算子开发中,代码量从500多行减少至80行,并保持与官方版本持平的性能[5] - 在H100上的MLA解码速度,TileLang编写的内核做到与FlashMLA相当[21] 行业生态适配与合作 - TileLang与国产算力生态适配,华为昇腾在第一时间公告对TileLang的支持[4] - 沐曦集成电路的高级总监董兆华与TileLang团队成员共同讨论沐曦GPU与TileLang的适配[5] - 该语言由北大团队主导开发,核心人物包括王磊、董宇骐以及北大计算机学院副研究员、博士生导师杨智[9] DeepSeek与TileLang的合作关系 - DeepSeek在v3.2中开源TileLang版本算子,其受关注程度超过新稀疏注意力机制DSA[1] - DeepSeek团队使用TileLang快速开发原型,之后用更底层的方法进一步优化性能,v3.2论文中提到在内核层面共享k-v提升计算效率,让DSA的闪电索引器机制运行速度远超传统实现[17] - DeepSeek v3.2验证了TileLang确实可以用来训练模型,TileLang发起人王磊发帖致敬DeepSeek敢于使用新编程语言开发核心产品[23]
DeepSeek发新模型;库克确认持有加密货币丨新鲜早科技
21世纪经济报道· 2025-09-30 02:50
AI大模型与开源生态 - DeepSeek发布V3-2-Exp模型并大幅下调API价格超过50% 同时华为云和寒武纪完成模型适配 [2] - 阿里通义7款模型入选全球开源前十 Qwen3-Omni登顶并斩获32项SOTA 模型全球下载量突破6亿次衍生超17万个 [5] - 寒武纪适配DeepSeek-V3-2-Exp并开源大模型推理引擎vLLM-MLU源代码 华为昇腾实现0day支持并开源推理代码 [12][13] 科技巨头战略动向 - 苹果CEO库克确认个人持有比特币和以太坊等加密货币 但明确苹果公司不会接受加密货币支付或投资其2000亿美元现金 [3] - 华为任命余承东为产品投资评审委员会主任 负责重大战略资源投入决策 同时其继续担任终端BG董事长 [6] - 小米17系列无削减订单计划 因新增标准版16GB+1TB版本及Pro系列加单 整体订单较上一代增加 [8][9] 企业合作与资本运作 - 赛力斯支付115亿元完成收购华为持有的引望智能10%股权 已付清第三笔转让价款34.5亿元 [4] - 斯年智驾完成数亿元B+轮融资 资金用于无人驾驶产品研发和市场开拓 [16] - 灵猴机器人完成超亿元A轮融资 资金用于工业自动化及机器人核心零部件研发及产能扩充 [17][18] 新能源汽车与供应链 - 赛力斯2025年上半年归母净利润29.41亿元同比增长81.03% 拟每10股派现3.10元合计5.06亿元占净利润17.22% [14] - 宁德时代计划至2030年在海南投资建设100座换电站 实现核心城区10分钟找站 [10] - 英联股份预计前三季度归母净利润3450万元至3750万元 同比增长1531.13%至1672.97% 受益于易开盖市场占有率提升 [15] 科技应用与监管环境 - 美团无人机在深圳上线夜间配送服务 累计完成超60万单 平均配送时长15分钟效率提升近100% [19] - 国家税务总局重申平台企业不得向外卖员快递员转嫁涉税义务 月收入低于6250元无需预扣税款 [7] - 我国发布首项个人信息跨境安全管理国家标准 将于2026年3月1日实施 [11]
科创芯片ETF指数(588920)涨超2.2%,DeepSeek发布新模型V3.2-Exp
新浪财经· 2025-09-30 02:31
科创板芯片指数及成分股表现 - 上证科创板芯片指数(000685)于2025年9月30日09:52强势上涨2 14% [1] - 成分股佰维存储(688525)上涨7 66% 燕东微(688172)上涨7 10% 乐鑫科技(688018)上涨5 24% 翱捷科技(688220)和澜起科技(688008)等个股跟涨 [1] - 科创芯片ETF(588920)上涨2 30% 最新价报1 65元 [1] 指数构成与权重 - 上证科创板芯片指数从科创板上市公司中选取业务涉及半导体材料和设备 芯片设计 芯片制造 芯片封装和测试的证券作为样本 [2] - 截至2025年8月29日 指数前十大权重股包括寒武纪 海光信息 中芯国际 澜起科技 中微公司等 [2] - 前十大权重股合计占比62 02% [2] 人工智能技术进展与行业影响 - DeepSeek于9月29日更新实验性AI模型DeepSeek-V3 1-Exp 引入名为DeepSeek Sparse Attention(DSA)的稀疏注意力机制 [1] - DSA机制可在长上下文中进行更快 更高效的训练和推理 [1] - 天风证券指出AI存储革命已至 "以存代算"催生核心机遇 可显著节省算力消耗并加速AI推理 [1] - "以存代算"趋势将带动SSD需求增速高于传统曲线 建议关注存储模组厂商和存储芯片 [1]
DeepSeek和智谱都将于近日发布新模型,或将迎来重大突破
搜狐财经· 2025-09-30 02:00
公司动态:DeepSeek - DeepSeek于9月29日发布新模型DeepSeek-V3.2并上传至社区平台HuggingFace [2] - 公司于8月正式发布了DeepSeek-V3.1模型 [2] - DeepSeek-V3.1的主要升级包括采用混合推理架构,一个模型同时支持思考模式与非思考模式 [2] - DeepSeek-V3.1相比DeepSeek-R1-0528能在更短时间内给出答案,思考效率更高 [2] - 新模型通过Post-Training优化,在工具使用与智能体任务中的表现有较大提升 [2] 公司动态:智谱 - 智谱新模型GLM-4.6也将于近日发布,目前部分用户已可通过API接口调用 [2] - 智谱在7月发布了新一代旗舰模型GLM-4.5,专为智能体应用打造的基础模型 [2] - GLM-4.5首次在单个模型中实现将推理、编码和智能体能力原生融合 [2] - 智谱于8月推出全球100B级效果最佳的开源视觉推理模型GLM-4.5V,总参数106B,激活参数12B [2] 行业趋势 - DeepSeek和智谱是中国最为头部的大模型企业,两家公司都有望迎来新的重大进展 [2] - 行业头部公司近期密集进行模型迭代,技术发展迅速 [2]
AI概念股多数走高 DeepSeek新模型成本下降超50% 机构看好AI应用商业化拐点临近
智通财经· 2025-09-30 01:52
华泰证券曾表示,模型降价将吸引更多的开发者开发AI应用,或进一步提振算力需求,提升Super App 出现概率。中银国际认为,AI应用商业化拐点临近。在算力层,推理效率与性价比大幅提升,国产芯 片加速替代;在模型层,通用大模型的能力已逐步达到商用标准;在数据层,行业专属数据的积累与合 成数据技术成熟之下,企业加速实现数据闭环训练与模型微调。三者共同推动AI能力从"单点突破"走 向"体系协同",为AI应用大规模商业化落地创造条件。 AI概念股早盘多数走高,截至发稿,汇量科技(01860)涨4.47%,报19.88港元;迈富时(02556)涨4.33%, 报51.35港元;创新奇智(02121)涨3.65%,报7.95港元;第四范式(06682)涨3.15%,报65.5港元;美图公 司(01357)涨3.26%,报9.16港元。 消息面上,DeepSeek昨日宣布,官方App、网页端、小程序均已同步更新为DeepSeek-V3.2-Exp。 DeepSeek介绍,得益于新模型服务成本的大幅降低,官方API价格也相应下调,新价格即刻生效。在新 的价格政策下,开发者调用DeepSeek API的成本将降低50%以上。 ...
港股异动 | AI概念股多数走高 DeepSeek新模型成本下降超50% 机构看好AI应用商业化拐点临近
智通财经· 2025-09-30 01:52
AI概念股市场表现 - 汇量科技(01860)早盘上涨4.47%至19.88港元 [1] - 迈富时(02556)早盘上涨4.33%至51.35港元 [1] - 创新奇智(02121)早盘上涨3.65%至7.95港元 [1] - 第四范式(06682)早盘上涨3.15%至65.5港元 [1] - 美图公司(01357)早盘上涨3.26%至9.16港元 [1] 行业催化事件 - DeepSeek宣布其官方App、网页端、小程序同步更新为DeepSeek-V3.2-Exp [1] - DeepSeek新模型服务成本大幅降低,官方API价格即刻下调 [1] - 开发者调用DeepSeek API的成本将降低50%以上 [1] - 国家发改委表示将多措并举支持各类企业深度参与人工智能+行动 [1] 机构观点与行业趋势 - 模型降价将吸引更多开发者开发AI应用,或进一步提振算力需求 [2] - 模型降价可能提升Super App出现概率 [2] - AI应用商业化拐点临近,算力层推理效率与性价比大幅提升 [2] - 国产芯片在算力层加速替代 [2] - 通用大模型能力已逐步达到商用标准 [2] - 行业专属数据积累与合成数据技术成熟推动企业实现数据闭环训练与模型微调 [2] - AI能力正从“单点突破”走向“体系协同”,为大规模商业化落地创造条件 [2]
DeepSeek新模型开源,新架构亮了,国产AI芯片集体狂欢
36氪· 2025-09-30 01:15
模型发布与核心创新 - DeepSeek于9月30日宣布开源实验版模型DeepSeek-V3.2-Exp,该模型首次引入DeepSeek Sparse Attention稀疏注意力机制,被定义为迈向新一代架构的中间步骤[1] - 新架构通过Lightning Indexer和细粒度token选择机制,将注意力计算复杂度从传统的二次方降至近似线性水平,大幅提升长文本训练和推理效率[36][38] - 模型在几乎不影响输出效果的前提下显著提升效率,采用了继续预训练+后训练的方式,包括专家蒸馏和混合强化学习等技术创新[36][38] 性能表现与基准测试 - 在各领域公开评测集上,DeepSeek-V3.2-Exp与DeepSeek-V3.1-Terminus表现基本一致:MMLU-Pro均为85.0分,GPQA-Diamond从80.7降至79.9,Humanity's Last Exam从21.7降至19.8[5][39] - 部分领域表现有所提升:BrowseComp从38.5提升至40.1,BrowseComp-zh从45.0提升至47.9,Codeforces-Div1从2046提升至2121[5][39] - 模型完成任务使用的token量大幅减少,但在某些测试中因生成推理token更少导致分数略有下降,使用中间检查点可缩小差距[5][38] 成本优化与市场推广 - DeepSeek执行新的价格政策,API调用成本降低50%以上,输出100万token价格从12元降至3元,降幅达75%[3] - 华为云、PPIO派欧云、优刻得等云平台已宣布上线DeepSeek-V3.2-Exp模型,华为、寒武纪、海光信息等AI芯片厂商完成Day 0适配[5][10][13][15][17] - 华为昇腾设备上实现128K长序列输出,首token输出耗时低于2秒,每token输出耗时低于30毫秒的推理速度[10] 实际应用体验反馈 - 用户测试显示DeepSeek-V3.2-Exp在10万token代码库上速度提升明显,但编写代码更为简短,有时影响功能实现[19][26][27] - 在信息检索任务中生成结果更为简短用词朴素,但推荐内容不符合新手友好要求,存在能力让步现象[29][31] - 用户反馈指出模型在工作记忆、计算精度稳定性方面存在短板,有偷懒倾向和陷入死循环的可能[32][34] 技术影响与行业意义 - 该模型作为实验性版本,主要贡献在于理论层面展示长文本处理中兼顾性能与效率的新路径,DSA机制处于原型期但实用性显著[36][38][44] - 产业界与开发者圈反响热烈,寒武纪在DeepSeek官宣后4分钟即宣布完成适配,可能意味着厂商在模型发布前已启动适配工作[15][21] - 训练曲线与前代模型保持相似稳定性,表明新架构在收敛性上没有额外风险,为未来技术优化奠定基础[42][44]