Workflow
UE8M0 FP8
icon
搜索文档
半导体行业8月份月报:本土芯片替代加速,国内云厂商AI算力投资持续增长-20250905
东海证券· 2025-09-05 06:02
行业投资评级 - 标配 [1] 核心观点 - 半导体行业持续回暖 价格涨幅扩大 关注AI算力 AIOT 半导体设备和关键零部件等结构性机会 [7] - 8月电子板块涨跌幅24.79% 半导体板块涨跌幅27.22% 半导体估值PE处于5年96.53%分位数 [7] - 8月半导体整体价格涨幅扩大 需求持续回暖 9月需求或进一步复苏 全球半导体6月销售额同比19.58% 1-6月累计同比19.21% [7] - 下游需求中TWS耳机 可穿戴腕式设备 AI服务器 新能源车复苏较好 2025Q2全球智能手机出货量同比1.03% 中国智能手机6月出货量同比-9.29% [7] - 英伟达停产H20芯片 2025Q2中国地区营收同比下降24.49% 深度求索发布DeepSeek-V3.1 国产替代有望加速 [7] - 国内云厂商阿里云业务营收33.98亿元 占总营收13.49% 同比增长25.80% 资本开支386.8亿元 同比增长220% [8] - 腾讯Q2资本开支191.1亿元 同比增长119% [8] 月度行情回顾 半导体板块涨跌幅 - 申万电子行业8月涨跌幅24.79% 同期沪深300涨跌幅10.33% 超额收益率14.46% [14] - 半导体板块8月涨跌幅27.22% 消费电子涨幅最大 海内外市场台湾半导体指数涨跌幅0.24% 美国费城半导体指数涨跌幅1.09% [16] - 半导体行业涨幅最高个股寒武纪+110.36% 涨幅最小个股派瑞股份+0.80% [17] - 中国半导体指数与费城半导体指数走势2023年后出现背离 2024年10月后申万半导体指数呈现较大涨幅 [19] 半导体估值回顾 - 半导体近期估值小幅震荡上行 A股半导体行业PE估值2013年以来最高189.12 最低29.87 平均PE83.95 中位数PE83.32 [24] - 当前半导体历史5年分位数PE96.53% PS91.91% PB67.95% 历史10年分位数PE85.63% PS94.44% PB81.58% [28] 公募基金持仓分布 - A股半导体超过1000亿元市值企业有9家 寒武纪市值6243.84亿元 中芯国际市值5600.65亿元 海光信息市值4521.30亿元 [31] - 2025Q2公募基金持仓股票市值中电子行业排第一位 高达4455.06亿元 [33] - 公募基金配置半导体规模长期占电子行业6成左右 2025Q2占比69% 市值3096.26亿元 占公募基金总持仓股票市值11.98% [33] - 2025Q2公募基金重仓TOP20半导体个股均为市值200亿元以上企业 持仓市值TOP20企业占所有持仓半导体市值比例87.27% [36] 半导体供需数据跟踪 半导体价格与销量 - 全球半导体6月销售额同比19.58% 2025年1-6月累计同比19.21% [38] - 8月存储模组价格涨跌幅区间-1.69%-10.22% 存储芯片DRAM和NAND FLASH价格涨跌幅区间-5.14%-14.70% [38] - 存储模组价格呈现周期波动特性 目前处于阶段性底部向上 [41] - 全球半导体硅片面积2025Q2同比9.62% 2025Q1-Q2累计同比6.03% [59] 半导体库存一览 - 7月日本生产者成品库存指数显示半导体与电子库存指数底部震荡 [62] - 全球芯片大厂库存与周转天数维持较高分位 2025Q2环比Q1周转天数有所下降但库存仍维持高位 [62] - 海外头部科技厂商2025Q2业绩大多实现营收和净利润同比增长 英特尔月涨幅+22.98% 苹果+11.96% 亚德诺+11.88% [75] - 2025Q2 A股62家半导体上市企业库存水平同比上升15.0% 环比上升6.5% [78] - 62家A股上市半导体公司2025Q2营收同比10.0% 环比9.9% 净利润同比32.5% 环比19.7% [79][81] 半导体供给 - 日本半导体设备7月出货额同比增长18.06% 2025年1-7月累计出货额同比增长19.76% [82] - 全球半导体设备2025Q1出货额同比增长21.31% [82] - 2025Q2晶圆厂台积电 台联电数据显示晶圆价格和产能利用率同环比均有所上涨 [85] 半导体下游需求数据跟踪与预测 半导体下游需求预测 - 预计2025年全球半导体下游需求继续维持复苏态势 智能穿戴 智能家居 AI服务器增速或将更高 [89] - 2025年预测手机出货量12.60亿台 同比增长2.30% PC出货量2.74亿台 同比增长4.23% 平板出货量1.70亿台 同比增长15.37% [89] 全球与中国手机出货量 - 中国大陆智能手机2025年6月出货量同比-9.29% 2025年1-6月累计出货量同比-3.89% [91] - 全球智能手机2025Q2出货量同比1.03% 2025年1-6月累计同比1.28% [95]
DeepSeek发布的这串符号,对国产芯片意味着什么
21世纪经济报道· 2025-09-02 15:36
文章核心观点 - 深度求索公司在新模型DeepSeek V3 1文档中提及的"UE8M0 FP8"参数格式 是针对下一代国产芯片设计的创新计算格式 通过牺牲局部精度换取全局稳定性和计算效率 旨在适配国产芯片硬件短板并构建自主算力生态 引发资本市场对国产芯片行业的高度关注 [2][5][6][9] 技术定义与特性 - "FP8"代表8位浮点计算格式 适用于深度学习等场景 其中"UE8M0"特指无符号 8位指数 0位尾数的参数格式 通过纯指数编码简化计算操作 [5] - UE8M0格式数据范围与FP32相当 但计算速度更快 数值范围优于E5M2等FP8变体 有利于模型训练稳定性 但需以精度牺牲为代价 [6] - 该格式特别适配Transformer架构的AI大模型 因其自注意力机制依赖浮点大量程 实现"牺牲局部精度换取全局稳定" [6] 国产芯片适配逻辑 - 国产芯片在先进制程 算力密度和功耗方面存在短板 UE8M0 FP8通过算法创新降低算力负荷 简化指数移位和加法操作 弥补硬件差距 [9] - 该格式有助于打破英伟达CUDA生态垄断 其开源特性可成为国产芯片重建自主生态体系的关键 [9] - 寒武纪思元590及未来690系列芯片原生支持FP8计算 沐曦 燧原等厂商也表态适配 但尚未明确使用UE8M0混合参数模型 [12] 应用场景与优势 - 除大语言模型外 UE8M0 FP8适用于明确定义的专用AI场景 如自动驾驶 人形机器人的多模态VLA模型 需大量程 高稳定性和高效率 [10] - 在工业质检 政务文档处理等低延迟 高准确率且成本敏感的场景中 该格式能发挥高效稳定特点 适配千行百业"AI+"需求 [10] 行业影响与竞争态势 - DeepSeek凭借行业地位向芯片厂商提出标准 推动国产芯片根据其生态系统定义设计 [12] - 国产芯片如寒武纪宣称新品在专用场景能力达英伟达H100的80% 但英伟达Blackwell系列采用FP4混合精度架构 国产芯片追赶仍需时间 [12] - 多数专家认为国产芯片需依靠性能竞争优势才能最终成功 [13]
DeepSeek发布的这串符号,对国产芯片意味着什么
21世纪经济报道· 2025-09-02 15:26
文章核心观点 - UE8M0 FP8是一种针对国产芯片设计的创新浮点格式 通过牺牲局部精度换取全局计算效率和稳定性 适用于AI大模型训练及专用场景 可能成为国产算力生态突破的关键技术路径 [1][5][7] 技术特性 - FP8代表8位浮点计算格式 其中UE8M0特指无符号8位指数0位尾数的参数配置 通过纯指数编码简化计算操作 [3] - 该格式数据范围与FP32相当(指数位均为8位) 但计算速度更快 相比E5M2类FP8格式具有更大数值范围 [5] - 采用科学计数法记录数据 适用于图形处理/科学计算/深度学习等需要大量程的应用场景 [3] 国产芯片适配优势 - 有效降低计算功耗 基于国产芯片规格限制定制 对计算资源受限的国产硬件更加友好 [5][7] - 将复杂计算简化为指数移位和加法操作 大幅降低算力负荷 弥补国产芯片在7nm及以下先进制程的算力密度短板 [7] - 摆脱对英伟达CUDA生态的依赖 采用开源格式有利于国产芯片建立自主生态系统 [7] 应用场景 - 特别适用于Transformer架构的AI大模型 其自注意力机制依赖浮点大量程特性 [5] - 在多模态VLA模型(自动驾驶/人形机器人)/工业质检/政务文档处理等专用场景中展现低延迟/高稳定性优势 [8][9] - 支持企事业单位进行大语言模型本地化私有化部署 通过语料后训练满足专用用途需求 [8] 产业影响 - DeepSeek V3.1发布引发资本市场关注 寒武纪股价8月涨幅达110% 其思元590及未来690系列芯片均原生支持FP8计算 [11] - 沐曦/燧原等国产AI芯片厂商明确表态适配FP8计算 阿里巴巴即将推出自研AI算力芯片但未明确FP8适配计划 [11] - 国产芯片对英伟达Hooper架构追赶初见成效 寒武纪新品在专用场景能力达H100的80% 但Blackwell系列采用FP4架构形成新一代技术壁垒 [11]
DeepSeek的一串“符号”背后:对国产芯片意味着什么?
21世纪经济报道· 2025-09-02 13:44
UE8M0 FP8 技术解析 - UE8M0 FP8 是一种无符号、8位指数、0位尾数的浮点参数格式 专为下一代国产芯片设计 [1][3] - 该格式通过牺牲局部精度换取全局稳定 特别适用于Transformer架构的AI大模型训练 能提供与FP32相近的数据范围但计算速度更快 [3] - 相比海外厂商采用的E3M4或E5M2等标准FP8格式 UE8M0 FP8是中国市场定制化方案 可有效降低计算功耗并适配国产芯片规格限制 [4] 国产芯片适配优势 - UE8M0 FP8通过简化计算为指数移位和加法操作 大幅降低算力负荷 弥补国产芯片在7nm及以下先进制程的算力密度短板 [5] - 该格式打破英伟达CUDA生态垄断 为国产芯片提供开源、无厂商绑定的新生态构建机会 [5] - 寒武纪思元590及未来690系列芯片原生支持FP8计算 沐曦、燧原等国产AI芯片厂商均表态适配FP8 [8] 应用场景拓展 - 格式特别适用于多模态VLA模型 满足自动驾驶、人形机器人等场景对高效计算和大动态范围的需求 [6] - 在工业质检、政务文档处理等专用场景中 能实现低延迟、高准确率的AI推理 且对成本敏感 [6] - 深度求索通过本地化部署和语料后训练 推动UE8M0 FP8在企事业单位私有化AI应用中的落地 [5] 产业影响与竞争格局 - DeepSeek V3.1发布后 寒武纪8月股价涨幅达110% 引发资本市场对国产算力行业的高度关注 [8] - 深度求索凭借行业地位向芯片厂商输出标准 推动其根据自身生态系统定义芯片设计 [8] - 国产芯片(如寒武纪)在专用场景性能达英伟达H100的80% 但面对Blackwell系列FP4架构及特供中国B30a芯片 仍存在技术追赶空间 [8] 发展前景 - 国内芯片最终成功需依赖性能具备充分竞争优势 [9] - UE8M0 FP8配合混合参数精度 有望成为千行百业"AI+"的更优解决方案 [6]
DeepSeek-V3.1适配下一代国产芯片引爆市场,大模型这次和哪些国产芯一起“自主可控”?
36氪· 2025-09-01 11:37
产品发布与市场反应 - DeepSeek于8月21日正式发布DeepSeek-V3.1模型 主要升级包括混合推理架构、更高思考效率及更强Agent能力 [1] - 新模型采用UE8M0 FP8参数精度 专为下一代国产芯片设计 [1] - 发布次日FP8概念股大幅上涨 寒武纪、和而泰、佳都科技均涨停 [1] FP8技术解析 - FP8为8位浮点数格式 通过拆分符号位、指数位和尾数位平衡数值范围与精度 [4][5][6] - UE8M0 FP8为无符号格式 指数位8位、尾数位0位 以牺牲精度换取极大动态范围 [7][8] - 该格式需依赖算法与硬件设计弥补精度问题 与国产芯片特性高度适配 [8] 低精度计算演进背景 - FP32为早期AI训练标准格式 但显存占用高 AlexNet训练需消耗约1.5TB显存 [11][12] - FP16将存储需求减半 计算速度提升2倍以上 但存在梯度溢出问题 [14] - BF16指数位扩展至8位 动态范围与FP32相当 成为GPT-3等大模型训练首选 [14] - 英伟达2022年Hopper架构首次原生支持FP8 吞吐量翻倍且显存占用减半 [15] 国产芯片协同设计意义 - 主流FP8多采用英伟达E4M3/E5M2格式 国产GPU因电路与指令集差异无法直接兼容 [18][21] - UE8M0格式优先考虑动态范围 可提升国产芯片数值稳定性 避免梯度爆炸 [21] - 软硬件协同设计减少非英伟达架构移植阻力 加速国产AI基础设施投产 [22] - 该合作被视为应对美国AI芯片出口限制、实现技术自给自足的关键举措 [22] 国产生态适配进展 - 中国信通院自2025年2月开展DeepSeek适配测试 30余家企业参与 首批8家通过认证 [23][25] - 适配系统在语言理解与逻辑推理任务精度上与国外系统持平 单机8卡可推理671B模型 [25] - 华为、寒武纪、海光等企业硬件产品均通过适配 涵盖芯片、服务器与云服务关键环节 [25] 行业竞争态势 - 英伟达于2025年6月推出NVFP4格式 4位精度可实现16位训练精度 技术迭代加速 [26][27] - 国产模型与芯片厂商仍需持续追赶技术差距 但已通过协同设计建立初步生态基础 [27]
寒武纪凭什么?
虎嗅APP· 2025-09-01 00:07
文章核心观点 - 国内AI产业崛起成为A股市场最大预期差 美国AI霸权战略面临瓦解 寒武纪作为国产AI芯片龙头体现突围成效[3][4][6] 美国AI霸权战略 - 特朗普政府发布《赢得AI竞赛:AI行动计划》提出三大支柱:加速创新巩固技术领先 建设AI基础设施确保算力优势 引领国际AI外交与安全[7][8][9] - 美国企图通过主导全球AI治理规则建立技术联盟 形成技术依附-政策协同的粘性关系[10] 中国AI突围路径 - 通过软件创新适配国产硬件:DeepSeek采用UE8M0 FP8参数精度为国产芯片量身设计 使国产GPU能通过流水线方式高效完成复杂计算任务[12][13] - 开源生态打破闭源封锁:中国厂商选择开源路线降低使用成本 OpenAI被迫开源GPT-oss模型并采用与DeepSeek相同的MoE架构[15][16] - 中美AI技术差距缩小:顶尖AI实验室性能差距从一年多缩短至不足三个月[17] 寒武纪基本面变化 - 订单结构改善:早期依赖华为IP授权业务(2017-2019年占比98.34%/99.69%/15.49%) 后转向政府算力建设 现因英伟达H20芯片存在安全风险(性能仅为H100的15%-30%) 互联网大厂采购转向国产厂商(2025Q1中国企业订购H20达160亿美元)[20][21][22] - 盈利能力提升:2025年上半年营收28.80亿元同比增长4347.82% 归母净利润10.38亿元扭亏 研发费用仅增长2.01% 研发投入占营收比例降至15.85%[26][27][31] 估值与市场预期 - 当前估值水平过高:动态市盈率276.48倍 滚动市盈率5117.75倍 市净率113.98倍 显著高于软件行业平均水平(市盈率88.97倍/市净率5.95倍)[34][36] - 资产重估三阶段:预期重估(国产替代叙事)→业绩分化(半年报扭亏证实逻辑)→价值重估(估值锚切换至PS等成长性指标)[35][36] - 业绩指引:公司预计2025年全年营收50-70亿元 但市场传言明年净利润可达200亿元[28][29][36] 行业竞争格局 - 寒武纪产品较其他国产GPU厂商无断崖式领先 替代英伟达市场的叙事存在不确定性 若其他厂商上市可能分流市场关注度[37]
股价逼近茅台,寒武纪还能走多远?
虎嗅· 2025-08-28 00:06
核心观点 - 寒武纪股价因DeepSeek发布适配国产芯片的FP8技术标准而暴涨 市值突破5800亿元并超越中芯国际 但公司基本面与估值存在显著落差 市盈率达4010倍 盈利可持续性及生态建设面临挑战 [1][3][5][15] 市场表现与估值 - 2025年8月22日寒武纪股价单日涨幅20%达1243.2元 总市值突破5200亿元 8月25日再度大涨11.4%至1384.93元 市值逼近5800亿元 [1] - 公司滚动市盈率达4010倍 远超行业平均水平 高盛采用2030年盈利预测的远期估值折现法将目标价上调至1835元 [5] - 国产算力概念股集体暴涨 包括海光信息和中科曙光 市场将事件解读为产业链结构性利好 [4] 技术突破与产业意义 - DeepSeek于2025年8月21日发布V3.1大模型 提出UE8M0 FP8参数精度技术 专为下一代国产芯片设计 [1] - FP8为8位浮点数格式 相比FP16或BF16可减半内存占用与带宽需求 提升计算速度与能效 [2] - UE8M0格式牺牲尾数精度以扩大数值表示范围 适配国产芯片硬件逻辑 是软硬协同的优化方案 [2] - 标志AI产业从硬件追赶软件转向软件定义硬件 上游算法厂商主动定义国产硬件标准 可能打破英伟达CUDA生态壁垒 [3][4] 财务基本面 - 2025年Q1营业收入11.11亿元 同比增长4230.22% 归母净利润3.55亿元 实现扭亏为盈 [7] - 净利润中约7600万元为政府补助 1.2亿元为信用减值损失转回 核心业务经营利润约2.76亿元 [7] - 2020至2023年公司持续净亏损 自我造血能力仍处构建阶段 [8] - 前五大客户收入占比达85%至92% 客户高度集中 [9] - 经营活动现金流量净额为负 存货27.55亿元 预付款项9.73亿元 现金流承压 [10] 行业竞争与生态挑战 - 国内AI芯片厂商分为GPGPU路线(海光信息、沐曦等追求CUDA兼容)和自研架构路线(寒武纪、华为昇腾构建自主生态) [12] - 寒武纪云端产品思元590性能对标英伟达A100 软件栈包括NeuWare、MagicMind和BANG C [12] - 英伟达CUDA生态拥有全球数百万开发者及超80%市场份额 软件工具链成熟度远超国产MLU生态 [13] - UE8M0 FP8标准仅为生态建设起点 全面抗衡CUDA仍需长期突破 [14]
从芯片到超节点 国产算力合纵连横大时代开启
21世纪经济报道· 2025-08-27 12:33
国产算力生态协同发展 - 国产算力产业链通过芯片、服务器、智算集群的产业聚合寻求高效解法,大模型厂商和平台型厂商加速应用落地 [1] - 产业链从芯片架构创新、超节点高速互联到系统级能效重构形成高度耦合的生态格局,实现算力自主的体系性跃迁 [2] - 产业链拉通需底层芯片、软件生态、服务器整机、智算环节协同,开源开放成为破局关键路径 [3] 技术路线与生态建设 - DeepSeek应用UE8M0 FP8路线提升计算效率并减少存储传输开销,为国产芯片厂商指明趋势方向 [4] - 芯片厂商同时重视DeepSeek精益求精路线和OpenAI"大力出奇迹"路线,需提升基础设施能力以吸引生态开发 [4] - OISA 2.0协议支持AI芯片数量提升至1024张,带宽突破TB/s级别,互联时延缩短至数百纳秒 [5] - 中国移动推出全调度以太网(GSE)技术体系,支持千卡级组网能力,推进技术规范和大容量交换芯片发布 [6] - 服务器厂商与国产GPU芯片厂商深度合作进行软硬件适配,共同完善国产算力生态 [7] 异构计算与平台化解决方案 - 高性能计算与智算融合需解决硬件架构差异,联想通过"一横五纵"战略构建覆盖通用、科学、AI算力的异构智算平台 [8] - 智算中心建设需推进全流程标准体系、核心技术自主创新、政产学研协同生态及重点领域专项行动 [9] - 一体机通过"通用基座+垂直增强"模式实现行业适配,需结合具体业务场景进行模型调优和性能测试 [9] - 同泰怡构建覆盖轻量化至满血版大模型的全栈解决方案,在教育、能源、电网、政务、医疗等行业实现落地 [10] 液冷技术发展与能效优化 - 冷板式液冷改造速度快,浸没式液冷技术复杂度高,液冷部署受供电、散热、承重、运维条件限制 [11] - 液冷技术降低PUE值并提升算力密度,长周期TCO优势显著,芯片结温可降低15°C至25°C [11][12] - 冷板式液冷与风冷系统高度兼容,改造难度低周期短成本可控,联想开发双循环浸没式液冷技术实现PUE值1.035 [12][13] - 联想推动低成本冷板方案实现风液同价,研发相变冷板应对更高功耗芯片散热需求 [12]
收评:寒王赛茅台 风水轮流转
搜狐财经· 2025-08-27 09:52
市场技术分析 - 主要指数出现十字星线和孕线结构 预示变盘 技术面倾向向下变盘[1] - 深成指四连阳创新高 创业板创反弹新高后冲高回落[1] - 科创50创反弹新高 涨幅显著[1] 板块表现分化 - 科技股大涨而其他板块普跌 呈现极端结构性行情[1] - AI算力芯片板块领涨+3.86% 稀土磁材+3.63% 光电共封装CPO+3.48%[8] - 液态金属板块下跌-2.86% 有色锑-2.83% 中日韩自贸区-2.79%[8] 英伟达产业链影响 - 英伟达业绩报告前市场出现分歧 其股价4个月内翻倍[1] - H20和B30入华对国产替代构成利空[1] - 英伟达停产H20时 国产替代爆发 DS发布下一代芯片设计点燃炒作热情[1] 个股表现 - 寒武纪股价突破1465元/股 年内涨幅超120% 超越贵州茅台成为A股"股王"[3] - 寒武纪中报业绩大增 带动国产芯片板块上涨+1.03%[8] - 剑桥科技涨停+10.00%[8] 资金流向 - 主力资金净流出超900亿元 收盘预计超1000亿元[5] - 近期资金持续流出:周三净流出776亿 周二563亿 周一净流入139亿 上周五803亿[5] - 个股涨跌比显著失衡 下跌4100只vs上涨1200只[5] 板块轮动预期 - 科技股涨幅过大面临调整压力[7] - 消费白酒板块存在补涨机会 银行板块具护盘作用[7] - 大宗商品涨价预期受美联储9月降息概率推动[7] - A股总市值从底部增长30万亿 资金可能流向低位消费、地产、环保、光伏、煤炭等板块[9] 投资策略建议 - 科技股以5日均线作为重要参照指标 破位则需减仓[8] - 周四周五为中报密集披露期 需防范未预告业绩不佳个股[8] - 寒武纪超越茅台被视为科技股炒作泡沫盛极而衰标志[9] - 建议布局防守板块和补涨预期板块[8]
芯片股延续近期涨势 国产模型绑定国产芯片 机构看好国产芯片行情持续推进
智通财经· 2025-08-27 05:03
芯片股表现 - 中芯国际股价上涨5.52%至59.3港元 [1] - 晶门半导体股价上涨4%至0.52港元 [1] - 上海复旦股价上涨2.66%至34.7港元 [1] - 华虹半导体股价上涨2.26%至54.4港元 [1] 技术突破 - DeepSeek-V3.1版本采用UE8M0 FP8参数精度 [1] - UE8M0 FP8专为下一代国产芯片设计 [1] - 国产芯片有望实现大规模应用 [1] 国产芯片生态 - 沐曦690、芯原VIP9000、寒武纪690等新一代国产芯片均支持FP8格式 [1] - 摩尔线程MUSA 3.1 GPU与海光深算三号同样支持FP8 [1] 行业前景 - 国产AI芯片设计技术与制造工艺持续提升 [1] - 国产大模型发展推动对国产芯片的适配支持 [1] - 国产算力市占率有望持续增长 [1] - 国产芯片行情预计持续推进 [1]