PD分离

搜索文档
计算机行业深度:国产ASIC:PD分离和超节点—ASIC系列研究之四
申万宏源证券· 2025-09-29 01:54
核心观点 - ASIC芯片在AI推理侧的成本效益优势显著,能效比和成本降低表现突出,市场规模增长迅速,2028年全球AI ASIC市场规模有望达1250亿美元[5][6] - 国产ASIC发展呈现PD分离和超节点两大趋势,头部云厂商自研成果显著,国产设计服务商在产业链成熟与需求增长共振下有望放量[13][15] - 小核酸药物市场从罕见病向常见病领域加速扩容,2033年全球市场规模预计达467亿美元,国内企业聚焦心血管等大病种研发[14][17] - 国产算力生态持续完善,GPU厂商沐曦股份累计出货2.5万颗芯片,2024年中国AI芯片市场规模超270万张[16][17] - 风电行业盈利修复趋势明确,2025年6月风机投标均价同比提升10.3%,海风市场预期共振推动估值切换[22][23] 行业表现数据 - 主要指数表现:上证指数下跌0.65%,深证综指下跌1.54%;风格指数中大盘指数近6个月涨幅16.84%,小盘指数涨幅17.2%[2] - 涨幅居前行业:化学纤维(昨日+3.08%,近6个月+12.99%)、风电设备(昨日+2.67%,近6个月+33.05%)、动物保健(昨日+2.06%,近6个月+24.03%)[2] - 跌幅居前行业:消费电子(昨日-4.79%,近6个月+47.38%)、元件Ⅱ(昨日-4.5%,近6个月+75.89%)、游戏(昨日-4.01%,近6个月+67.02%)[2] ASIC芯片行业 - ASIC与GPU技术边界趋同但商业模式差异显著:ASIC为专用芯片聚焦特定推理场景,GPU需覆盖全场景通用需求[5][15] - 成本优势验证:谷歌TPU v5能效比为英伟达H200的1.46倍,亚马逊Trainium2训练成本较GPU降低40%,推理成本降55%[5][15] - 头部厂商增长强劲:博通2024年AI ASIC收入122亿美元,2025年前三季度达137亿美元,季度环比增速超越英伟达[5][15] - 推理需求驱动市场:ChatGPT C端WAU达7亿,OpenRouter的Token消耗量近一年增长近10倍,外采芯片需承担厂商高额利润(英伟达FY2025净利率57%)[6][15] - 设计服务商格局:博通和Marvell份额领先,博通凭借30亿美元IP投入、TPU设计经验及3.5D封装技术建立壁垒[6][15] 国产ASIC发展 - 云厂商自研进展:百度昆仑芯第三代实现万卡集群部署并中标10亿元中国移动订单;阿里平头哥PPU显存带宽超英伟达A800,签约中国联通16384张算力卡订单;字节计划2026年前量产自研芯片[15] - 国产服务商优势:芯原股份具备5nm工艺能力,翱捷科技在手订单充足,灿芯股份依托中芯国际布局成熟制程[15] - 技术趋势:PD分离(华为异腾950分PR/DT型号适配不同场景)、超节点(海光开放HSL协议,华为灵衢总线支持8192卡扩展)[15] 小核酸药物行业 - 技术优势:研发周期短、靶点丰富、效果持久,直接作用于mRNA层面靶向"不可成药"靶点[14] - 市场规模:全球从2019年27亿美元增长至2023年46亿美元(CAGR 14.3%),预计2033年达467亿美元(CAGR 26.1%)[17] - 研发方向:海外聚焦罕见病向常见病跨越,国内直接切入心血管、乙肝、癌症等大病种[17] - 重点企业:国内关注瑞博生物、圣诺医药、舶望制药等,海外龙头包括Alnylam、Ionis、Arrowhead[17] 国产算力与GPU - 市场规模:2024年中国加速芯片市场规模超270万张,本土品牌AI芯片出货量超82万张,GPU市场规模约1000亿元,ASIC/DSA芯片规模约425亿元[17] - 生态建设:Deepseek V3.1引入FP8精度适配国产芯片,阿里未来三年计划投入超3800亿元用于AI算力,字节2025年算力采购预算约900亿元[17] - 沐曦股份:累计出货2.5万颗GPU,2023-2025年主力产品曦云C500系列收入从1547万元增长至3.1亿元(2025Q1),占主营业务收入97.87%[17] 其他重点行业 - 风电行业:风机投标均价1616元/千瓦(同比+10.3%),2026年欧洲海风装机量预计8.7GW(同比+107%),主机环节盈利弹性突出[22][23] - 万国数据:全球IDC巨头,25H1营收56.23亿元(同比+12.4%),在建IT功率379MW,储备资源900MW,境外DayOne板块在建+储备超1200MW[21][23] - 新疆众和:铝电子材料全产业链布局,新建240万吨氧化铝项目预计2026年投产,依托港口区位降低运输成本[18][20] - 紫光国微:股权激励覆盖466名核心骨干,要求2025-2028年净利润较2024年增长10%/60%/100%/150%,对应CAGR 25.7%[25][27][29]
国产 ASIC:PD 分离和超节点:ASIC 系列研究之四
申万宏源证券· 2025-09-26 13:28
投资评级 - 报告对国产ASIC行业持积极看法,认为ASIC设计服务商迎来发展机遇,博通、Marvell、国内芯原股份、翱捷科技、灿芯股份有望受益 [2] 核心观点 - ASIC在能效与成本上优势突出,专用芯片特性使其在推理场景更具优势,AI渗透率提升带动推理需求激增,拓宽ASIC市场空间 [1][3] - ASIC设计复杂度高,专业分工下设计服务商价值凸显,博通等头部服务商凭借完整IP体系、封装技术和量产经验巩固行业地位 [1][3] - 国内云厂商自研ASIC已有独立成果,并非跟随海外路径,百度、阿里、字节等头部厂商推动国产ASIC放量,本土设计服务商迎来战略机遇 [1][3] - PD分离与超节点成为国产ASIC发展的两大核心趋势,华为、海光等厂商已形成自主技术体系,采用开源开放模式适配多元化需求 [1][4] 目录总结 大模型推理带动ASIC需求 - 2028-2030年全球AI芯片市场规模有望达5000亿美元,AI基础设施支出预计达3-4万亿美元 [8] - ASIC专用性强,谷歌TPU v5能效比为英伟达H200的1.46倍,亚马逊Trainium2训练成本较GPU降低40%,推理成本降55% [14][15] - 推理需求激增驱动ASIC需求,ChatGPT C端WAU达7亿,OpenRouter统计Token消耗量一年翻近10倍 [21][29] - 博通2024年AI ASIC收入122亿美元,2025年前三季度达137亿美元,AMD预计2028年全球AI ASIC市场规模达1250亿美元 [1][30] ASIC设计复杂度高,服务商价值凸显 - ASIC设计需前端需求定义与后端技术落地,云厂商多依赖服务商,博通、Marvell为全球主要服务商 [36][41] - 谷歌TPU成功离不开与博通合作,博通优势包括30亿美元投入积累的完整IP体系、TPU设计经验、3.5D XDSiP封装技术、高速互联与CPO技术 [1][55] - 博通2024年AI ASIC收入122亿美元,2025年前三季度达137亿美元,季度环比增速超越英伟达 [1][55] 国内ASIC发展并非跟随 - 2025H1中国AI云市场CR5超75%,头部云厂需求旺盛,百度昆仑芯迭代至第三代,实现万卡集群部署并中标10亿元中国移动订单 [1][74][75] - 阿里平头哥PPU显存容量96GB、带宽700GB/s超英伟达A800,签约中国联通16384张算力卡订单 [76][78] - 字节2020年启动芯片自研,计划2026年前量产,国产服务商芯原股份、翱捷科技、灿芯股份各具优势 [1][80][82] 国产ASIC技术趋势:PD分离与超节点 - PD分离指Prefill与Decode任务用不同芯片完成,华为昇腾950分PR和DT型号适配不同场景 [1][94][95] - 超节点通过高带宽互联形成统一计算体,海光开放HSL协议吸引寒武纪等参与,华为开放灵衢总线支持超8192卡扩展 [1][104][107] - 英伟达Rubin CPX为海外首个芯片级PD分离实践,采用GDDR7替代HBM降低成本,华为昇腾950PR/950DT分别针对Prefill和Decode优化 [90][92][95]
ASIC系列研究之四:国产ASIC:PD分离和超节点
申万宏源证券· 2025-09-26 12:46
报告行业投资评级 - 看好 [2] 报告核心观点 - ASIC专用芯片在AI大模型推理阶段具备显著成本效益优势,能效比和单位算力成本表现突出,验证了其商业化拐点 [3] - AI渗透率提升推动推理需求激增,Token消耗量近一年翻近10倍,驱动ASIC市场空间扩大,预计2028年全球AI ASIC市场规模达1250亿美元 [3][31][32] - ASIC设计服务商在产业链中价值凸显,博通等头部服务商凭借完整IP体系、先进封装技术和量产经验获得持续订单,国内厂商如芯原股份、翱捷科技、灿芯股份迎来发展机遇 [3][60][89][90] - 国产ASIC发展呈现PD分离和超节点两大趋势,华为昇腾950分型号适配不同场景,海光、华为构建开放互联生态,区别于海外封闭路径 [3][99][107][115] 大模型推理带动ASIC需求 - ASIC与GPU技术边界趋同,但商业模式差异显著:ASIC为下游场景高度耦合的专用芯片,GPU需覆盖多场景属通用芯片 [3][14][15] - ASIC能效比优势突出,谷歌TPU v5能效比为英伟达H200的1.46倍,亚马逊Trainium2训练成本较GPU方案降低40%,推理成本降55% [3][18] - 自研ASIC可显著降低TCO,外采芯片需承担厂商利润,英伟达FY2025净利率达57%,其数据中心AI芯片收入1022亿美元 [3][21] - 推理需求激增驱动ASIC放量,ChatGPT C端WAU达7亿,OpenRouter统计Token消耗量从2024年9月不足0.5T提升至2025年8月接近5T [3][25][31] ASIC设计复杂度高,服务商价值凸显 - 谷歌TPU成功离不开与博通合作,博通核心优势包括30亿美元投入积累的完整IP体系、TPU设计经验、3.5D XDSiP封装技术及高速互联能力 [3][59][60][69] - 博通2024年AI ASIC收入122亿美元,2025年前三季度达137亿美元,季度环比增速超越英伟达 [3][60] - 芯片设计连贯性带来高客户转换成本,服务商壁垒稳固,头部云厂如谷歌、亚马逊、Meta、微软均依赖博通、Marvell等专业服务商 [3][44][60][75] - 国内设计服务商各具优势:芯原股份具备5nm工艺能力和丰富IP积累,翱捷科技在手订单充足,灿芯股份依托中芯国际布局成熟制程 [3][89][90][91] 国内ASIC发展机遇 - 2025H1中国AI云市场CR5超75%,头部云厂自研ASIC成果显著:百度昆仑芯实现万卡集群部署并中标10亿元中国移动订单,阿里平头哥PPU显存带宽超英伟达A800并签约16384张算力卡订单,字节计划2026年前量产自研芯片 [3][78][83][84][87] - 国产ASIC服务商覆盖不同技术需求,芯原股份2024年芯片量产收入8.6亿元、芯片设计7.2亿元、IP授权7.4亿元,灿芯股份芯片量产收入8.1亿元 [3][91] - SerDes等关键IP国产化加速,国内厂商如芯潮流、晟联科、集益威已布局56Gbps-112Gbps产品,但224Gbps仍依赖海外 [3][95] 国产ASIC技术趋势:PD分离与超节点 - PD分离成为推理场景主流趋势,Prefill任务计算密集型,Decode任务内存带宽受限,华为昇腾950分PR和DT型号适配不同场景 [3][97][99][107] - 英伟达Rubin CPX专为Prefill优化,采用GDDR7替代HBM降低成本,预计2026年底上市 [3][99][103] - 超节点通过高带宽互联整合多处理器,国内海光开放HSL协议吸引寒武纪等参与,华为开放灵衢总线支持超8192卡扩展,均采用开源开放模式 [3][109][115][117] - 华为昇腾950PR采用自研低成本HiBL 1.0 HBM,950DT采用HiZQ 2.0 HBM,内存带宽达4TB/s,互联带宽2TB/s [3][107]
锦秋小饭桌想喊你一起吃饭!
锦秋集· 2025-06-18 15:46
锦秋小饭桌活动概况 - 每周五晚在北京、深圳、上海、杭州等地举办AI创业者闭门社交活动,已举办15场,覆盖4个城市 [4] - 参与者包括技术极客、产品专家、初创创始人、上市公司高管、投资人等多元背景 [3] - 活动形式从饭桌拓展到茶桌,话题涵盖芯片架构、出海策略、多模态技术等前沿领域 [3][72] AI Infra赛道洞察 - 英伟达在训练芯片市场占据绝对优势,但推理芯片市场将迎来ASIC主导的爆发期,形成GPU、ASIC、FPGA多元竞争格局 [15][16] - 存储墙突破是芯片架构创新关键方向,3D堆叠架构中单层DRAM方案较成熟,多层方案需2-3年优化良率 [17][18] - 大模型推理采用PD分离架构(预填充与解码阶段分设备部署)成为行业共识,可提升资源利用率 [20] AI国际化与出海策略 - 中美产品设计差异显著:中国偏好All-in-One应用,美国倾向功能单一、自由组合的轻量化工具 [26] - 硬件出海需结合中国供应链优势与海外原生需求,如Rabbit、电动房车等创新源自本地场景 [32][37] - 合规挑战包括GDPR数据存储规则、文化习惯差异(如日本印章文化)、以及专利保护等风险 [29][30][34] - 成功路径:产品打磨→众筹验证→小批量试产→规模化量产,核心在于供应链整合与需求本质挖掘 [36] AI消费电子与垂类应用 - 游戏行业AIGC落地面临资产生成质量瓶颈,骨骼/权重生成结合传统流程更易商业化 [57][58] - 垂类Agent场景爆发,如政府申报服务(250美元/月订阅)、保险经纪人匹配等高频刚需场景 [59][60] - 区域市场特性:北美依赖众筹破圈,欧洲重线下渠道,中东追求极致履约速度(如15分钟配送) [70][71] 技术趋势与产品方法论 - 大模型Memory技术提升个性化体验,RAG与长上下文技术路径尚未明朗 [55][56] - 稀疏化架构可能减少算力需求数量级,DeepSeek提出线性复杂度创新方案 [63][64] - 情绪价值是AI产品护城河,需将情感连接设计为核心功能而非点缀 [85] - 早期增长策略:聚焦"不会但想用"的腰部用户,快速MVP试错,速度即护城河(窗口期仅2-3周) [84][87][88] 多模态与交互创新 - GPT-4o将语音交互延迟压缩至200毫秒(接近人类对话阈值),推动Voice Agent落地 [76] - 存量游戏创新比开发新游戏ROI更高,如基于陪伴场景的拟人化交互依赖VLM能力 [75][78] - 音乐模型需突破训练速度与后处理技术瓶颈,拟人化细节增强用户黏性 [77][78]