AI大模型推理

搜索文档
国产 ASIC:PD 分离和超节点:ASIC 系列研究之四
申万宏源证券· 2025-09-26 13:28
投资评级 - 报告对国产ASIC行业持积极看法,认为ASIC设计服务商迎来发展机遇,博通、Marvell、国内芯原股份、翱捷科技、灿芯股份有望受益 [2] 核心观点 - ASIC在能效与成本上优势突出,专用芯片特性使其在推理场景更具优势,AI渗透率提升带动推理需求激增,拓宽ASIC市场空间 [1][3] - ASIC设计复杂度高,专业分工下设计服务商价值凸显,博通等头部服务商凭借完整IP体系、封装技术和量产经验巩固行业地位 [1][3] - 国内云厂商自研ASIC已有独立成果,并非跟随海外路径,百度、阿里、字节等头部厂商推动国产ASIC放量,本土设计服务商迎来战略机遇 [1][3] - PD分离与超节点成为国产ASIC发展的两大核心趋势,华为、海光等厂商已形成自主技术体系,采用开源开放模式适配多元化需求 [1][4] 目录总结 大模型推理带动ASIC需求 - 2028-2030年全球AI芯片市场规模有望达5000亿美元,AI基础设施支出预计达3-4万亿美元 [8] - ASIC专用性强,谷歌TPU v5能效比为英伟达H200的1.46倍,亚马逊Trainium2训练成本较GPU降低40%,推理成本降55% [14][15] - 推理需求激增驱动ASIC需求,ChatGPT C端WAU达7亿,OpenRouter统计Token消耗量一年翻近10倍 [21][29] - 博通2024年AI ASIC收入122亿美元,2025年前三季度达137亿美元,AMD预计2028年全球AI ASIC市场规模达1250亿美元 [1][30] ASIC设计复杂度高,服务商价值凸显 - ASIC设计需前端需求定义与后端技术落地,云厂商多依赖服务商,博通、Marvell为全球主要服务商 [36][41] - 谷歌TPU成功离不开与博通合作,博通优势包括30亿美元投入积累的完整IP体系、TPU设计经验、3.5D XDSiP封装技术、高速互联与CPO技术 [1][55] - 博通2024年AI ASIC收入122亿美元,2025年前三季度达137亿美元,季度环比增速超越英伟达 [1][55] 国内ASIC发展并非跟随 - 2025H1中国AI云市场CR5超75%,头部云厂需求旺盛,百度昆仑芯迭代至第三代,实现万卡集群部署并中标10亿元中国移动订单 [1][74][75] - 阿里平头哥PPU显存容量96GB、带宽700GB/s超英伟达A800,签约中国联通16384张算力卡订单 [76][78] - 字节2020年启动芯片自研,计划2026年前量产,国产服务商芯原股份、翱捷科技、灿芯股份各具优势 [1][80][82] 国产ASIC技术趋势:PD分离与超节点 - PD分离指Prefill与Decode任务用不同芯片完成,华为昇腾950分PR和DT型号适配不同场景 [1][94][95] - 超节点通过高带宽互联形成统一计算体,海光开放HSL协议吸引寒武纪等参与,华为开放灵衢总线支持超8192卡扩展 [1][104][107] - 英伟达Rubin CPX为海外首个芯片级PD分离实践,采用GDDR7替代HBM降低成本,华为昇腾950PR/950DT分别针对Prefill和Decode优化 [90][92][95]
旋极信息:浙江曲速新产品TGU01芯片主要用于AI大模型推理场景
证券日报· 2025-09-04 09:45
公司产品动态 - 浙江曲速新产品TGU01芯片主要用于AI大模型推理场景 [2] - 该芯片目前已经适配DeepSeek软件 [2] 行业技术应用 - AI大模型推理场景成为芯片产品重要应用方向 [2]
旋极信息(300324.SZ):浙江曲速新产品TGU01芯片主要用于AI大模型推理场景,目前已经适配deepseek软件
格隆汇· 2025-09-04 04:01
公司产品进展 - 浙江曲速新产品TGU01芯片主要用于AI大模型推理场景 [1] - 该芯片已经适配deepseek软件最新版本 [1]
英伟达:FY25Q4业绩点评:FY25Q4业绩超预期,Blackwell需求强劲,推理计算需求高速增长-20250228
光大证券· 2025-02-28 00:22
报告公司投资评级 - 买入(维持)[4][6] 报告的核心观点 - 英伟达 FY25Q4 业绩超市场预期,数据中心和汽车业务收入高速增长,AI 大模型推理需求加速增长,Blackwell 需求强劲且供应链问题解决,预计 FY2026 - 2028 业绩延续高速增长,维持“买入”评级[1][2][4] 根据相关目录分别进行总结 业绩情况 - FY25Q4 营收 393.3 亿美元,YoY + 78%,QoQ + 12%,超彭博一致预期;Non - GAAP 毛利率 73.5%,QoQ - 1.5pct,YoY - 3.2pct;Non - GAAP 净利润 220.7 亿美元,QoQ + 10%,YoY + 72%,对应 Non - GAAP EPS 0.89 美元,超彭博一致预期[1] - FY25 全年收入 1305 亿美元,同比上升 114%,超彭博一致预期;Non - GAAP 净利润 742.6 亿美元,同比增加 130%,对应 EPS 2.99 美元,超彭博一致预期[1] - FY26Q1 指引营收 430 亿美元,YoY + 65%,QoQ + 9%,超彭博一致预期;Non - GAAP 毛利率 71%,QoQ - 3pct,低于彭博一致预期[1] 业务板块 - 数据中心业务 FY25 全年营收 1152 亿美元,YoY + 142%;FY25Q4 营收 356 亿美元,QoQ + 16%,YoY + 93%,约 50%收入来自大型云厂商,Q4 营收贡献占比增至 90.6%,Hopper200 出货持续环比增长,Blackwell 需求强劲贡献约 110 亿美元收入,大模型对推理芯片需求持续增长[2] - 游戏业务 FY25 全年营收 114 亿美元,YoY + 9%;FY25Q4 营收 25 亿美元,YoY - 11%,QoQ - 22%,Q4 出货量受供应链限制影响,假期需求强劲,预计 FY26Q1 出货量恢复增长,搭载 GeForce RTX 50 系列显卡的笔记本电脑 3 月起发售[2] - 专业可视化业务 FY25 全年营收 19 亿美元,YoY + 21%;FY25Q4 营收 5 亿美元,YoY + 10%,QoQ + 5%,客户对 RTX GPU 工作站需求持续提升[2] - 汽车业务 FY25 全年营收 17 亿美元,YoY + 55%;FY25Q4 营收 6 亿美元,YoY + 103%,QoQ + 27%,增长系自动汽车持续量产爬坡[2] 行业趋势 - Open AI o3、DeepSeek - R1 等大模型推动推理需求加速增长,长思维推理相比一次性推理需超 100 倍数据量,未来 AI 大模型计算需求远超当前大语言模型,Blackwell 因高 Token 吞吐量和低成本需求持续提升,其供应链问题已解决,下一代 Blackwell Ultra 2025 年下半年发布[3] 盈利预测与估值 - 预计 Blackwell 平台和 AI 大模型推理需求增长驱动英伟达 FY2026 - 2028 业绩高速增长,维持 FY2026 - FY2027 GAAP 净利润预测 1301.62/1843.24 亿美元,新增 FY2028 GAAP 净利润预测 2374.51 亿美元,对应 FY2026 - 2028 GAAP 净利润同比增速 78.6%/41.61%/28.82%,对应 FY2026 - 2028 GAAP EPS 为 5.33/7.55/9.73 美元,2 月 26 日收盘价 131.28 美元对应 FY2026/FY2027 25x/17x PE[4]
【英伟达(NVDA.O)】FY25Q4业绩超预期,Blackwell需求强劲,推理计算需求高速增长——FY25Q4业绩点评
光大证券研究· 2025-02-27 13:48
文章核心观点 英伟达发布FY25Q4及FY25全年业绩,业绩超市场预期,各业务有不同表现,AI大模型推理需求加速增长,下一代产品将推出 [2][3][4] 业绩情况 - FY25Q4营收393.3亿美元,YoY+78%,QoQ+12%,超彭博一致预期;Non - GAAP毛利率73.5%,QoQ - 1.5pct,YoY - 3.2pct;Non - GAAP净利润220.7亿美元,QoQ+10%,YoY+72%,对应Non - GAAP EPS 0.89美元,超彭博一致预期 [2] - FY25全年收入1305亿美元,同比上升114%,超彭博一致预期;Non - GAAP净利润742.6亿美元,同比增加130%,对应EPS 2.99美元,超彭博一致预期 [2] - FY26Q1指引营收430亿美元,YoY+65%,QoQ+9%,超彭博一致预期;Non - GAAP毛利率71%,QoQ - 3pct,低于彭博一致预期 [2] 业务表现 数据中心业务 - FY25全年营收1152亿美元,YoY+142%;FY25Q4营收356亿美元,QoQ+16%,YoY+93%,约50%收入来自大型云厂商,Q4营收贡献占比增至90.6% [3] - Hopper200出货持续环比增长,Blackwell需求强劲,贡献约110亿美元收入,大模型对推理芯片需求持续增长 [3] 游戏业务 - FY25全年营收114亿美元,YoY+9%;FY25Q4营收25亿美元,YoY - 11%,QoQ - 22%,Q4出货量受供应链限制影响,假期需求维持强劲 [3] - 公司预计FY26Q1出货量将恢复增长,搭载GeForce RTX 50系列显卡的笔记本电脑将于3月起发售 [3] 专业可视化业务 - FY25全年营收19亿美元,YoY+21%;FY25Q4营收5亿美元,YoY+10%,QoQ+5%,客户对RTX GPU工作站需求持续提升 [3] 汽车业务 - FY25全年营收17亿美元,YoY+55%;FY25Q4营收6亿美元,YoY+103%,QoQ+27%,增长系自动汽车持续量产爬坡 [3] AI发展情况 - Open AI o3、DeepSeek - R1等大模型推动推理需求加速增长,长思维推理相比一次性推理,需要超100倍的数据量,未来AI大模型计算需求会远超当前大语言模型 [4] - Blackwell需求将持续提升,其供应链问题已解决,下一代Blackwell Ultra将于2025年下半年发布 [4]