昇腾950

搜索文档
ASIC系列研究之四:国产ASIC:PD分离和超节点
申万宏源证券· 2025-09-26 12:46
报告行业投资评级 - 看好 [2] 报告核心观点 - ASIC专用芯片在AI大模型推理阶段具备显著成本效益优势,能效比和单位算力成本表现突出,验证了其商业化拐点 [3] - AI渗透率提升推动推理需求激增,Token消耗量近一年翻近10倍,驱动ASIC市场空间扩大,预计2028年全球AI ASIC市场规模达1250亿美元 [3][31][32] - ASIC设计服务商在产业链中价值凸显,博通等头部服务商凭借完整IP体系、先进封装技术和量产经验获得持续订单,国内厂商如芯原股份、翱捷科技、灿芯股份迎来发展机遇 [3][60][89][90] - 国产ASIC发展呈现PD分离和超节点两大趋势,华为昇腾950分型号适配不同场景,海光、华为构建开放互联生态,区别于海外封闭路径 [3][99][107][115] 大模型推理带动ASIC需求 - ASIC与GPU技术边界趋同,但商业模式差异显著:ASIC为下游场景高度耦合的专用芯片,GPU需覆盖多场景属通用芯片 [3][14][15] - ASIC能效比优势突出,谷歌TPU v5能效比为英伟达H200的1.46倍,亚马逊Trainium2训练成本较GPU方案降低40%,推理成本降55% [3][18] - 自研ASIC可显著降低TCO,外采芯片需承担厂商利润,英伟达FY2025净利率达57%,其数据中心AI芯片收入1022亿美元 [3][21] - 推理需求激增驱动ASIC放量,ChatGPT C端WAU达7亿,OpenRouter统计Token消耗量从2024年9月不足0.5T提升至2025年8月接近5T [3][25][31] ASIC设计复杂度高,服务商价值凸显 - 谷歌TPU成功离不开与博通合作,博通核心优势包括30亿美元投入积累的完整IP体系、TPU设计经验、3.5D XDSiP封装技术及高速互联能力 [3][59][60][69] - 博通2024年AI ASIC收入122亿美元,2025年前三季度达137亿美元,季度环比增速超越英伟达 [3][60] - 芯片设计连贯性带来高客户转换成本,服务商壁垒稳固,头部云厂如谷歌、亚马逊、Meta、微软均依赖博通、Marvell等专业服务商 [3][44][60][75] - 国内设计服务商各具优势:芯原股份具备5nm工艺能力和丰富IP积累,翱捷科技在手订单充足,灿芯股份依托中芯国际布局成熟制程 [3][89][90][91] 国内ASIC发展机遇 - 2025H1中国AI云市场CR5超75%,头部云厂自研ASIC成果显著:百度昆仑芯实现万卡集群部署并中标10亿元中国移动订单,阿里平头哥PPU显存带宽超英伟达A800并签约16384张算力卡订单,字节计划2026年前量产自研芯片 [3][78][83][84][87] - 国产ASIC服务商覆盖不同技术需求,芯原股份2024年芯片量产收入8.6亿元、芯片设计7.2亿元、IP授权7.4亿元,灿芯股份芯片量产收入8.1亿元 [3][91] - SerDes等关键IP国产化加速,国内厂商如芯潮流、晟联科、集益威已布局56Gbps-112Gbps产品,但224Gbps仍依赖海外 [3][95] 国产ASIC技术趋势:PD分离与超节点 - PD分离成为推理场景主流趋势,Prefill任务计算密集型,Decode任务内存带宽受限,华为昇腾950分PR和DT型号适配不同场景 [3][97][99][107] - 英伟达Rubin CPX专为Prefill优化,采用GDDR7替代HBM降低成本,预计2026年底上市 [3][99][103] - 超节点通过高带宽互联整合多处理器,国内海光开放HSL协议吸引寒武纪等参与,华为开放灵衢总线支持超8192卡扩展,均采用开源开放模式 [3][109][115][117] - 华为昇腾950PR采用自研低成本HiBL 1.0 HBM,950DT采用HiZQ 2.0 HBM,内存带宽达4TB/s,互联带宽2TB/s [3][107]
软件ETF(515230)盘中涨超2.4%,算力革新驱动行业逻辑变化
每日经济新闻· 2025-09-25 06:57
华为芯片与算力技术突破 - 华为发布昇腾950为基础的超节点 将成为全球最强超节点 性能超越英伟达2027年推出的NVL576系统[1] - 华为计划2027年四季度推出昇腾960超节点 提供充沛算力 并首发自研低成本HBM 支持FP8等更多精度格式[1] - 华为宣布"灵衢"互联协议 可组成超50万卡集群 显著提升大规模算力部署能力[1] 量子计算与产业投资动态 - 中国首家量子计算公司本源量子启动IPO 致力于打造自主可控工程化量子计算机 业务覆盖量子芯片与量子计算测控一体机等全栈式布局[1] - 英伟达将斥资50亿美元入股英特尔 微软投资73亿美元打造"世界最强AI数据中心" 反映全球算力投资持续高景气[1] 软件行业指数与投资工具 - 软件ETF(515230)跟踪中证全指软件指数(H30202) 选取系统软件、应用软件开发及相关服务业务的上市公司证券作为样本[1] - 该指数重点关注技术创新能力突出、市场占有率较高的企业 具有显著成长性和波动性特征[1] - 无股票账户投资者可关注国泰中证全指软件ETF联接A(012636)和联接C(012637)产品[1]
光刻机利好频传,半导体设备ETF(159516)直线涨停
每日经济新闻· 2025-09-24 09:26
F = 半导体设备弹性之选 热点直击 消息面,半导体频传利好。 1 华为公布华为AI算力全景图,推出昇腾950、异腾960、 异腾970等系列芯片; 2)阿里巴巴积极推进3800亿的AI基础设施建设; 3)国产光刻机测试取得积极进展。 半导体芯片产业链透视 台 国产替代周期 由于我国半导体芯片产业链被"卡脖子",国产 化率低,政策及产业长期推进国产芯片研发,以 实现技术的自主可控。周期时间为10到20年,甚 電車长。 半导 A T = = 14 E PS MEE ME 半导体产业链主要分为上游基础、中游制造、以及下 游应用三个环节: 上游基础环节 中游制造环节 下游应用环节 包括芯片设计、芯 包括EDA软件,以 包括人工智能、消 及半导体设备与材 片制造及封装测试 费电子等应用场 料等部分; 等步骤; 景。 其中半导体设备与材料是芯片制造与封装测试的基 础,位于产业链上游弹性更大。 影响半导体四十三十四 的竞赛程因表 『 需求周期 受全球经济周期波动影响,电子产品需求随之扩 张或收缩,从而影响到芯片需求,一般2到3年为 一个周期。 · 创新周期 技术进步,如人工智能等推动芯片运算速度和存 储容量升级,一般需要 ...
国产算力行情再度爆发,关注科创芯片ETF国泰(589100)
搜狐财经· 2025-09-23 01:39
往后看,AI新一轮的军备竞赛正在展开,且本轮需求由AI训练转向推理,投入的持续性将比上一轮更强。市场风险偏好改善的背景下,相关产业链的估 值尚有提升空间。建议投资者保持对科创芯片ETF国泰(589100)、芯片ETF(512760)的关注。 来源:WIND 9月15日盘后市场监管总局公布,英伟达公司违反《中华人民共和国反垄断法》和《市场监管总局关于附加限制性条件批准英伟达公司收购迈络思科技有 限公司股权案反垄断审查决定的公告》,市场监管总局依法决定对其实施进一步调查。与此同时,华为发布全新超节点和多颗昇腾系列芯片,昇腾950为 基础的超节点将成为全球最强超节点,而昇腾960超节点也将在2027年四季度上市,提供充沛算力。产业趋势上,国产替代势在必行,市场对AI算力产业 的景气度形成了高度一致的乐观预期。 从供给侧和需求侧的积极变化来看,国产算力的发展空间广阔。一方面以华为昇腾为代表的国产算力芯片持续迭代,为产业带来供给上的技术支持;另一 方面国内互联网大厂逐步适配国产芯片,资本开支的持续增长形成需求支撑。随着国内先进制程产能逐渐落地,国产自主可控的趋势已形成。例如2025年 内尽管海外AI芯片供应受限,但阿里 ...
华为的算力突围
是说芯语· 2025-09-22 23:32
华为全联接大会2025核心发布 - 华为官宣未来三年多款芯片及超节点演进路线 包括昇腾950构建的全球最强超节点 以及2027年四季度上市的昇腾960超节点 [5] - 鲲鹏950和鲲鹏960处理器将在通算领域超节点部署 [5] - 华为云CloudMatrix超节点规格将从384卡升级至8192卡 支持50~100万卡超大集群 AI算力实现重大突破 [5][7] 算力基础设施创新 - CloudMatrix384超节点采用架构创新 将资源池化为算力池、内存池、显存池 实现计算与存储任务解耦 推理性能大幅提升 [7] - 基于MatrixLink高速互联与多网合一技术 构建50~100万卡集群 单卡推理性能达中国特供版GPU H20的3~4倍 [7][8] - 华为云AI算力规模较去年增长268% 昇腾AI云客户从321家增至1805家 覆盖央国企、智驾、大模型等多行业 [25] 行业解决方案落地 - 盘古大模型在政务、金融、制造等30多个行业落地 覆盖500多个场景 云南交投案例中问答准确率提升20% 车流预测精度提升10% [12] - 华为云为万华化学实现2000多台设备预测性维护 模型准确率从70%提至90% 异常识别效率提升10% 人工巡检时间下降20% [24] - 在长安汽车研发效率提升30% 订单交付周期从21天缩短至15天 [25] 智能体平台与企业应用 - Versatile企业级智能体平台覆盖Agent开发、运营、运维全生命周期 开发效率提升3倍 数据迭代周期从周缩短至天 [13][15] - 华为云慧通差旅智能体"通宝"实现路径规划采用率超50% 差旅预订时间缩短至2分钟 [15] - 企业级智能体解决业务流程复杂、低幻觉容忍度、高运行要求等挑战 [13] 全球化服务能力 - 华为云覆盖34个地理区域、101个可用区 构建国内30ms、海外50ms时延的"全球一张网" [20] - 土耳其品牌Defacto实现659天0事故运行 页面加载时间从1.5秒缩至260毫秒 [20][21] - 巴西Neogrid公司数据集成效率提升40% 数据分析效率提升50% [21] 技术生态与行业地位 - 华为云在容器、数据库等9个领域入围Gartner魔力象限 17个解决方案位居领导者象限 获30余项细分领域第一 [25] - 政务、工业、金融、汽车四大行业市场份额第一 跻身医疗、药物、气象、汽车领导者象限 [25] - 为360纳米AI提供3000万Token处理能力 突破AI内存墙限制 [10]
恒为科技:积极关注华为昇腾新一代架构GPU的发布与应用
全景网· 2025-09-22 09:52
公司与华为昇腾的生态合作 - 合作主要体现在基于昇腾算力集群的运营以及客户模型优化与训练 [1] - 合作包括基于昇腾的推算算力一体机等方面 [1] - 昇腾950是华为近期新发布的产品规划 目前还未向市场投放 [1] - 公司关注华为昇腾新一代架构GPU的发布与应用 [1] - 公司期待进一步与相关AI芯片的系统架构上展开更深入合作 [1]
【招商电子】国产算力芯片链深度跟踪:华为披露AI芯片3年规划,国内自主可控加速发展
招商电子· 2025-09-19 15:21
华为全联接2025大会技术发布 - 华为发布灵衢超节点互联协议并宣布开发灵衢2.0技术规范,通过超节点架构实现多台物理机器深度互联,重新定义大规模算力新范式 [9][10] - 昇腾NPU未来三年路线图包括2026年推出950PR和950DT、2027年推出960、2028年推出970,其中950PR支持FP8算力1 PFLOPS并采用自研HBM,960算力为950的2倍水平 [2][15] - 鲲鹏CPU路线图显示2026Q4推出950、2028Q1推出960,持续支持超节点及高性能计算需求 [2][20] - Atlas 900 A3 SuperPoD支持384卡互联且算力达300 PFLOPS,已累计部署300多套 [2][22] - Atlas 950 SuperPoD支持8192卡方案,采用正交架构实现零线缆电互联,单柜功率100kW,总算力规模领先 [2][25] - Atlas 960 SuperPoD支持15448卡方案,FP8算力达30 EFLOPS,总互联带宽34 PB/s,计划2027Q4上市 [2][32] - 超节点集群产品Atlas 950 SuperCluster和960 SuperCluster算力规模分别超50万卡和达百万卡,计划2026Q4和2027Q4上市 [2][34] - 业界首个通算超节点Taishan 950 SuperPoD计划2026Q1推出,支持最大16节点和48TB内存,时延仅370纳秒 [2][44] - 企业级产品Atlas 850/860包含8个NPU,支持风冷需求,最大可形成1024卡集群 [2][49] - AI标卡Atlas 350采用昇腾950PR芯片,FP8算力850 TFLOPS,内存128GB,推荐推理场景性能提升2.5倍 [2][54] 国内AI算力芯片发展 - 海光激励计划设定2025-2027年营收同比增长目标为55%/45%/33%,三年CAGR 44%,对应收入142/206/275亿元 [3] - 寒武纪指引2025年营收50-70亿元,昆仑芯及阿里等自研芯片技术实力提升,国产替代进程加速 [3] - 中美博弈背景下本土AI算力芯片实力逐步提升,外交部回应停止采购英伟达部分芯片事件 [58] 半导体制造与设备国产化 - 国内光刻机产业链聚焦整机及光学/工作台/浸液系统等零部件,国产DUV整机落地将加速自主可控需求 [59] - 2026年国内先进逻辑产线扩产预期提速,中芯国际和华虹2025Q2稼动率环比上升,资本支出侧重先进制程 [62] - 长江存储三期公司成立带动先进存储扩产,国内设备/材料/零部件板块持续受益 [3][62] - 国内设备厂商2025Q2收入快速增长,产品迭代加速,先进产线国产替代率有望提升 [63] - 零部件厂商进入产能扩张阶段,材料领域掩膜板需求因多重曝光技术成倍增长 [63] 存储技术趋势与市场 - 推理侧存储需求提升,英伟达Rubin NVL144 CPX采用GDDR7替代HBM,通过存储提升算力效率 [4] - 2026年端侧产品放量,AI手机平均DRAM容量从8GB增至12-16GB,AI PC从12GB增至16-64GB,AI耳机NOR容量从64-128Mb增至256Mb [4] - 国内厂商如江波龙/佰维存储/德明利推出企业级存储解决方案,兆易创新和北京君正推进3D DRAM存算一体方案 [4] 投资方向聚焦 - 建议关注AI算力芯片/高端芯片制造/先进封装/存储/设备/材料/零部件/EDA/IP等方向 [5] - 具体覆盖代工/算力芯片/封测/设备/存储/EDA/IP/材料等细分领域标的 [5]