Workflow
MLU370
icon
搜索文档
主流国产AI算力芯片全景图
是说芯语· 2025-09-23 07:42
文章核心观点 - 人工智能算力芯片是国家人工智能战略的核心基础设施,国内AI芯片产业在国产化替代政策引导下蓬勃发展,形成多元化竞争格局,主要厂商分为三类:专攻训练与推理的ASIC厂商、主打CPU路线的厂商以及布局全栈解决方案的厂商 [1] - GPU占据AI芯片市场主导地位,2025年GPU将占AI芯片80%市场份额,通用型算力GPU因架构优化(缩减图形渲染功能)具有更优计算能效比,广泛应用于人工智能模型训练和推理领域 [1] - 国产AI芯片在性能、生态和供应链自主化方面持续突破,通过多精度计算支持、先进封装技术(如Chiplet)、软件生态兼容(如类CUDA平台)和集群级解决方案与国际厂商竞争,并深入行业应用场景 [37] AI芯片分类与技术特性 - AI芯片按部署位置分为云端芯片(承担训练和高带宽推理任务)和边缘/终端芯片(承担独立推理任务);按功能分为训练芯片和推理芯片 [3] - 主流AI芯片包括GPU、FPGA和ASIC(如VPU/TPU):GPU通用性强且适合大规模并行运算,但图形渲染功能在推理端无法发挥算力;FPGA可编程配置架构适应算法迭代,开发时间短(6个月),但量产单价高且峰值算力低;ASIC通过算法固化实现极致性能和能效,量产后成本最低,但研发时间长(1年)且技术风险大 [2] - 评价AI芯片性能的核心指标为算力(单位TOPS/TFLOPS)、功耗(性能功耗比)和面积(影响成本及良率),其中算力类型包括INT8、FP32等精度 [4][5] 国际厂商技术对比(英伟达) - 英伟达GPGPU采用微架构(Volta/Ampere/Hopper)、CUDA核、Tensor核、显存容量和带宽等硬件参数决定性能,代表产品V100/A100/A800/H100在算力、显存和互联技术上持续迭代 [6] - 具体性能对比:H100(Hopper架构)FP32算力51 TFLOPS、INT8算力1513 TOPS、显存带宽2TB/s,较A100(Ampere架构)FP32算力19.5 TFLOPS、INT8算力624 TOPS、显存带宽1935 GB/s显著提升;互联技术从NVLink 300 GB/s(V100)升级至NVLink 600 GB/s(H100) [6] 国产AI芯片厂商全景 - 国内厂商分为三类:ASIC路线(寒武纪、天数智芯、昆仑芯)、GPGPU路线(海光信息、壁仞科技、沐曦集成电路)和全栈解决方案路线(昇腾、平头哥、摩尔线程、燧原科技) [1][34] - 代表性上市公司:寒武纪(市值493亿元)、海光信息(市值1336亿元)、景嘉微(市值367亿元);非上市公司如沐曦(Pre-B轮融资10亿元)、天数智芯(C++轮融资超10亿元)通过多轮融资支持产品研发 [8] - 国产芯片制程以7nm为主(如寒武纪MLU370、海光DCU、天数智芯Big Island),部分采用12nm(平头哥含光800、燧原云燧i20),5nm技术处于研发中 [9][11][23][28] 厂商产品与技术特点 - 寒武纪:云边端产品矩阵(MLU370系列、Cambricon终端处理器),采用自主指令集架构(Cambricon ISA)支持动态可重构和低精度量化,算力达256 TOPS(INT8),制程7nm [10][11][12] - 海光信息:产品线包括CPU和DCU协处理器(深算系列),采用GPGPU架构兼容类CUDA环境,支持多精度计算和高带宽内存,深算一号显存带宽1024 GB/s(对比英伟达A100 2039 GB/s) [14][15][17] - 沐曦集成电路:聚焦高性能GPGPU,支持全线精度计算(FP32/FP16/BF16/INT8),注重软件生态兼容和能效优化 [18][19][20] - 壁仞科技:首款GPGPU芯片BR100采用Chiplet技术,FP16算力超1000T、INT8算力超2000T,擅长大模型训练 [22] - 燧原科技:训练推理全栈方案(云炬系列),云燧i20采用12nm工艺实现256 TOPS算力,单位面积效率媲美7nm GPU [23] - 平头哥:端云一体解决方案(含光800采用12nm工艺,算力820 TOPS),与阿里云生态协同 [28] - 昇腾:全栈生态系统(芯片+硬件+软件+应用),昇腾910B支持FP32/FP16精度,单卡性能对标英伟达A800/A100 [29] - 摩尔线程:基于MUSA架构覆盖AI计算与图形渲染,MTT S4000提供INT8算力200 TOPS、显存带宽768 GB/s,兼容X86/ARM和CUDA生态 [30][31][32] 性能与生态建设 - 国产芯片算力在INT8精度下普遍达100-200 TOPS(如燧原i20 256 TOPS、昆仑芯R200迭代升级),部分厂商支持FP64多精度计算和HBM高带宽内存 [9][23][25][37] - 软件生态通过兼容主流框架(PyTorch/TensorFlow)、构建类CUDA平台(海光DTK、沐曦MXMACA)及深度集成(昆仑芯与百度飞桨)降低开发门槛 [15][25][37] - 集群级解决方案成为竞争焦点,如华为昇腾超节点、壁仞科技光互连GPU超节点支持万卡级集群 [37] 应用场景与行业渗透 - 芯片应用覆盖互联网、安防、金融、政务、能源、科研等领域,具体场景包括智能数据分析、模型训练、边缘计算和自动驾驶(如地平线征程5用于自动驾驶) [2][12][16][25] - 厂商通过适配主流大模型(DeepSeek/LLaMA/ChatGLM)和行业定制化解决方案(如寒武纪用于推荐系统、海光用于商业计算)实现深度软硬协同 [12][16][37]
马云还有“狠招”!阿里备胎曝光,填补国内AI芯片空白!
搜狐财经· 2025-09-02 16:49
公司战略与投入 - 阿里巴巴宣布未来三年投入超过3800亿元用于建设云和AI硬件基础设施 [3] - 公司明确未来发展方向从互联网转向算力依赖AI芯片 [3] 技术研发突破 - 阿里巴巴自主研发新型AI推理芯片进入测试阶段完全采用国产供应链代工 [6][10] - 芯片兼容英伟达CUDA生态支持多模态推理实测ResNet50算力达125TOPS达到H20芯片约90%性能水平 [8] - 平头哥半导体已推出含光800倚天710镇岳510等多款芯片并在RISC-V架构领域形成三大系列处理器IP [8] 行业环境与政策背景 - 美国对中国高端芯片技术持续打压促使中国企业加速自主可控进程 [6][10] - 中国监管机构要求包括阿里巴巴腾讯等企业完全暂停采购NVIDIA芯片 [8] - 官方明确建议国内企业避免使用NVIDIA H20芯片因其存在性能限制和安全风险 [8] 市场竞争格局 - 中国AI芯片市场已涌现华为昇腾910B寒武纪MLU370等国产产品并在多个行业实现规模化应用 [10] - 阿里巴巴入局使国产AI芯片竞争力进一步提升推动行业自主创新进程加速 [12]
摩根士丹利:Investor Presentation-全球人工智能半导体需求与供应链
摩根· 2025-06-11 02:16
报告行业投资评级 - 行业投资评级为In-Line,即分析师预计该行业覆盖范围在未来12 - 18个月的表现与相关广泛市场基准一致 [7][209] 报告的核心观点 - 随着AI重塑日常生活,半导体行业面临前所未有的需求和地缘政治紧张局势,报告将对全球AI半导体市场进行概述,包括供应链的关键动态和中国加速AI本地化的推动 [1][4] 根据相关目录分别进行总结 半导体行业整体情况 - 2025年上半年逻辑半导体代工厂利用率为70 - 80%,仍未完全恢复;2024年增长缓慢,仅同比增长10%;2025年第一季度半导体供应链库存天数增加 [9][10] - 持续看到来自AI的巨大需求,NVIDIA需求旺盛,库存天数达到历史低点 [13][15] - 成熟节点代工厂利用率和盈利能力仍具挑战,毛利率仍较低,但2025年第一季度平均成熟节点代工厂利用率略有提高 [18][20][23] 细分市场情况 中国市场 - 预计中国前6大公司2025年资本支出将同比增长62%,达到3730亿元人民币;2024年中国GPU自给率为34%,预计到2027年将达到82%;预计2027年中国云AI总潜在市场规模将达到480亿美元;到2027年,中国本地GPU几乎可以满足中国AI需求,本地GPU收入可能增长到2870亿元人民币 [30][32][34] - 2025年3月中国半导体设备进口同比下降2%(3个月移动平均),来自大多数主要国家的半导体设备进口均下降 [39][41] - 主要云服务提供商的云资本支出依然强劲,2025 - 2026年云资本支出预计近7890亿美元;基于供应链数据的乐观假设下,2025年云AI半导体总潜在市场规模可能增长到2350亿美元 [49][51] 全球市场 - 预计到2030年,边缘AI半导体增长可能略快于云AI半导体;在云AI中,推理AI芯片增长将超过训练芯片,定制AI芯片增长将超过通用芯片 [54][55] - TSMC预计到2026年将CoWoS产能扩大到9万片/月;2025年将CoWoS和SoIC产能翻倍,但预计2026年扩张将减速 [61][66] - GPU供需需要时间来平衡,TSMC预计2025年生产510万片芯片,全年GB200 NVL72出货量预计达到3万片;2025年AI计算晶圆消费可能达到150亿美元,NVIDIA占大部分 [70][71][73] 技术与产品情况 - CPO有助于提高数据传输速度和降低功耗,是最节能的解决方案,正从收发器向CPO架构迁移 [76][78][81] - 关键投资辩论:AI ASIC此次能否成功;CSP即使有NVIDIA强大的AI GPU,仍需要定制芯片;总拥有成本分析显示ASIC与GPU相比仍具竞争力 [83][89][92] 市场趋势与应用情况 - 现场AI计算(NVIDIA GB10与MediaTek联合设计)可能成为关键市场趋势,DGX Spark可提供1PFLOPS的现场计算能力 [103] - 预计从2026年起,AI + AR眼镜用LCOS总潜在市场规模将逐步扩大 [112] - WoA(Windows on Arm)组合将是未来AI PC的理想选择,预计2028年AI PC渗透率将达到95%,从“Wintel”向“WoA”转变,WoA AI PC芯片将从x86手中夺取市场份额 [116][121][122] - 中国智能手机OEM厂商也开发了自己的大语言模型,如阿里巴巴Qwen、OPPO AndesGTP、小米MiLM AI助理、Vivo BlueLM AI助理 [123][124][125] 各细分领域情况 云半导体 - 进入2025年下半年,服务器相关公司月收入平均同比增长;2025年第一季度,前4大CSP(亚马逊、谷歌、微软和Meta)资本支出同比增长64% [131][133][135] DRAM - DRAM处于周期性底部,有新机会;Winbond为边缘计算提供可扩展CUBE解决方案,采用微凸块的CUBE 3D堆叠解决方案 [136][138][143] PC半导体 - 预计AI笔记本电脑迁移趋势将推动总潜在市场规模扩张27%;PC OEM平均库存天数仍处于较高水平 [150][152] EDA - 预计2023 - 2030年中国EDA市场收入复合年增长率为12%,达到33亿美元;中国EDA市场由美国公司主导,预计到2030年整体EDA自给率将提高到29% [159][161] FPGA - FPGA行业在2024年年中触底,尽管周期性复苏,但中国通信需求仍然疲软 [165] 功率半导体 - IGBT和MOSFET定价均已稳定,MOSFET定价恢复年度价格调整,IGBT定价同比趋势触底;扬杰科技在国内功率半导体领域独特,四分之一收入来自海外,2025年第一季度毛利率高于国内同行 [166][167][170] SiC - 2024年中国SiC衬底占全球市场份额的36%,而器件仅占全球市场份额的约9% [173] OSAT和后端设备 - JCET在国内OSAT中海外收入占比最高;受先进封装驱动,OSAT资本支出占销售额的比例回到历史高位;过去五年JCET本地收入增长低于同行 [176][177][179] MCU - MCU供应仍超过需求,汽车MCU更具机会;中国汽车MCU自给率较低,2025年第一季度生产商库存天数略有上升 [183][184][185] 公司评级情况 报告对众多公司给出了股票评级,如ACM Research Inc评级为O(Overweight),Advanced Wireless Semiconductor Co评级为E(Equal - weight)等,具体评级可参考报告表格内容,且股票评级可能会发生变化 [234][236]