海光信息(688041)
搜索文档
半导体行业2026年上半年投资策略:AI仍为创新主线算力、存力、设备、先进封装等多环节受益
东莞证券· 2025-11-24 11:57
核心观点 - 人工智能仍为科技行业创新主线,算力、存力、设备、先进封装等多环节有望受益 [2][4][5] - 2025年AI驱动半导体行业实现新一轮增长,前三季度营收同比增长13.95%,归母净利润同比增长48.21% [14] - 展望2026年,需关注AI带来的半导体硬件增量机遇及外部限制下各环节的国产替代进程 [5] 半导体板块业绩及行情回顾 - 2025年前三季度申万半导体板块实现营收4,993.67亿元,同比增长13.95%,归母净利润444.56亿元,同比增长48.21% [14] - 25Q3单季度营收1,781.72亿元,同比增长11.16%,环比增长3.95%,归母净利润199.72亿元,同比增长73.56%,环比增长33.62% [14] - 25Q3销售毛利率为29.41%,同比提升3.19个百分点,销售净利率为11.41%,同比提升4.29个百分点 [16] - 除分立器件外,其他细分板块25Q3营收、净利润均实现同比环比增长,数字芯片设计、模拟芯片设计净利润同比增幅分别达1422.73%和6819.03% [21] - 2025年1-9月全球半导体销售额5,394.3亿美元,同比增长20.42%,国内销售额1,498.8亿美元,同比增长10.96% [21] - 截至2025年11月18日,申万半导体板块年内累计上涨41.67%,跑赢沪深300指数25.57个百分点,集成电路制造、数字芯片设计、半导体设备子板块涨幅居前,分别为73.86%、57.49%和52.57% [23] 算力 - 全球算力规模从2019年的309 EFLOPS增至2024年的2207 EFLOPS,预计2029年将达14130 EFLOPS,2024-2029年复合增长率45.0% [46] - 中国大陆算力规模从2019年的90.0 EFLOPS增长至2024年的725.3 EFLOPS,预计2029年有望达5457.4 EFLOPS,2024-2029年复合增长率49.7% [46] - 北美四大云厂商25Q3资本开支合计约1,125亿美元,同比增幅约77%,谷歌、微软、亚马逊、Meta均表态2026年资本开支将继续增长 [55] - 英伟达FY26Q3营收达570.1亿美元,同比增长62%,数据中心营收512亿美元,同比增长66% [57] - 台积电25Q3营收331亿美元,同比增长41%,HPC平台营收占比57%,公司预计AI相关营收2024-2029年复合增长率将高于此前预测的44%-46% [65] - 预计2026年全球AI服务器出货量同比增长20%以上,占整体服务器比重上升至17.2% [67] - 2024年全球AI芯片市场规模约732.7亿美元,预计2030年达3,360.7亿美元,2024-2030年复合增长率28.90% [70] - 中国AI芯片市场规模预计从2024年的1,425.37亿元激增至2029年的13,367.92亿元,年均复合增长率53.7% [70] - 国内AI芯片企业加速资本市场布局,摩尔线程、沐曦股份等公司IPO进程推进,有望加速国产算力生态构建 [78][80] 存力 - AI应用爆发驱动存储市场需求激增,9月以来闪迪、美光、三星、西数等存储巨头陆续上调产品报价,幅度超出市场预期 [4] - AI服务器训练与推理带动对DDR5 RDIMM、eSSD等高性能存储产品需求增长,生成式AI向多模态发展进一步推动存储扩容 [4] - 企业级SSD在AI服务器中价值量是通用服务器的3倍以上,大容量QLC SSD因能提升存储密度与能效,成为AI服务器的高性价比选择 [85] - 2022年全球企业级SSD市场规模为204.54亿美元,预计2027年将达到514.18亿美元,年复合增长率20.25% [87] - 2024年中国企业级SSD市场规模达62.5亿美元,同比增长187.9%,预计2029年有望达到91亿美元 [87] 设备 - 半导体设备构成晶圆厂主要资本支出来源,受益于国内先进制程推进与"两长"产能持续扩充 [4] - 25Q3中国大陆半导体制造设备进口金额创历史新高,表明大陆晶圆扩产仍在积极推进,前道设备国产替代空间较大 [4] - 半导体设备子板块25Q3营收同比增长32.38%,净利润同比增长49.30% [21] 先进封装 - 后摩尔时代先进封装成为提升芯片性能的重要途径,有助于提高集成度,提升数据传输速度与带宽,实现异构集成并加快产品上市时间 [4][5] - 先进封装高度契合AI发展特点,海内外企业争相布局,有望成为后摩尔时代我国集成电路弯道超车的重要途径 [5] - 我国半导体封测产业整体竞争力较强且已形成全球化影响力,先进封装有助于提升产业链整体附加值 [5]
研报掘金丨浙商证券:维持海光信息“买入”评级,首次授予激励对象,产业链合作深化
格隆汇APP· 2025-11-24 06:53
公司股权激励 - 公司首次授予激励对象,截至2025年6月30日共有员工2803人,激励对象占比超30% [1] - 本次激励授予范围广、股权价值高、回报力度大,有利于加深员工与公司深度绑定,巩固核心人才壁垒 [1] - 股权激励为公司长期发展注入持久动能 [1] 产业链合作与技术发展 - 公司与信安世纪共建AI密算联合实验室,依托双方在算力和密码领域的深厚积累 [1] - 合作将密码技术深度嵌入算力芯片底层,为AI应用提供内生安全能力 [1] - 算力领军企业强强联合或将实现技术发展成果共享,促进产业链上下游优质资源整合 [1] - 合作进一步推动国产算力做大做强 [1]
计算机周观点第25期:算力、模型、应用协同深化,AI叙事迈向奇点关键期-20251124
海通国际证券· 2025-11-24 05:34
行业投资评级 - 报告对计算机板块维持“优于大市”评级 [3] 核心观点 - 谷歌实现多模态技术突破,腾讯与阿里巴巴推动AI应用普惠,摩尔线程与宇树科技引领硬科技资产资本化,算力、模型、应用三大环节协同演进 [1][3] 全球大模型技术进展 - 谷歌于11月18日发布Gemini 3模型,在数学、推理和多模态理解测试中全面超越GPT-5.1和Claude Sonnet 4.5等主流竞争对手 [3] - 谷歌同步推出Nano Banana Pro模型,显著提升图像中文本渲染准确度及物理世界认知能力,支持复杂场景多角色一致性并生成最高4K分辨率专业图像 [3] - Nano Banana Pro已深度整合进Adobe、Figma等主流创意软件,同时谷歌推出“Antigravity”智能体优先开发平台,重塑AI辅助编程体验 [3] 中国AI应用生态发展 - 阿里巴巴于11月17日上线对标ChatGPT的“千问”App公测版,标志其AI战略从B端向C端拓展 [3] - 蚂蚁集团于11月18日推出全模态通用AI助手“灵光”,支持在移动端通过自然语言30秒生成可交互小应用 [3] - 结合DeepSeek与通义等模型,杭州已形成覆盖文本、图像、视频及轻量级应用生成的完整AI应用生态 [3] - 腾讯于11月21日开源轻量级视频生成模型HunyuanVideo 1.5,基于DiT架构的创新SSTA稀疏注意力机制将推理显存需求大幅降至14GB [3] 硬科技领域资本化进程 - 国产GPU企业摩尔线程以每股114.28元发行价启动IPO,预计募集资金总额达80亿元,并于11月24日正式申购 [3] - 募资将重点投入新一代AI训练与推理芯片、图形处理器芯片的研发项目 [3] - 人形机器人企业宇树科技已完成上市辅导,计划在境内公开发行股票,产品线覆盖四足机器人、人形机器人H2及灵巧机械臂 [3] 推荐标的盈利预测 - 日联科技2024年预测EPS为1.25元,2025年预测为1.30元,2026年预测为2.16元,对应2024年PE为47.75倍 [4] - 金山办公2024年预测EPS为3.56元,2025年预测为4.03元,2026年预测为4.77元,对应2024年PE为85.87倍 [4] - 合合信息2024年预测EPS为4.93元,2025年预测为3.47元,2026年预测为4.27元,对应2024年PE为39.55倍 [4] - 海康威视2024年预测EPS为1.30元,2025年预测为1.47元,2026年预测为1.68元,对应2024年PE为22.99倍 [4] - 新大陆2024年预测EPS为1.00元,2025年预测为1.26元,2026年预测为1.55元,对应2024年PE为25.36倍 [4] - 道通科技2024年预测EPS为1.45元,2025年预测为1.43元,2026年预测为1.92元,对应2024年PE为22.31倍 [4] - 汉得信息2024年预测EPS为0.19元,2025年预测为0.26元,2026年预测为0.32元,对应2024年PE为87.53倍 [4] - 海光信息2024年预测EPS为0.83元,2025年预测为1.18元,2026年预测为1.59元,对应2024年PE为248.55倍 [4]
海光信息涨2.03%,成交额19.17亿元,主力资金净流出6567.74万元
新浪财经· 2025-11-24 03:10
股价与资金流向 - 11月24日盘中股价上涨2.03%至210.49元/股,成交额19.17亿元,换手率0.40%,总市值4892.50亿元 [1] - 当日主力资金净流出6567.74万元,特大单买入2.75亿元(占比14.37%),卖出3.25亿元(占比16.93%) [1] - 今年以来股价累计上涨40.68%,近5个交易日下跌1.42%,近20日下跌16.15%,近60日上涨13.13% [1] - 今年以来两次登上龙虎榜,最近一次为9月11日,龙虎榜净买入1.55亿元,买入总计23.60亿元(占总成交额14.75%),卖出总计22.05亿元(占总成交额13.79%) [1] 公司基本情况 - 公司位于北京市海淀区,成立于2014年10月24日,于2022年8月12日上市 [1] - 主营业务为研发、设计和销售应用于服务器、工作站等计算、存储设备中的高端处理器,主营业务收入构成为高端处理器99.73% [1] - 所属申万行业为电子-半导体-数字芯片设计,概念板块包括中科院系、算力概念、并购重组、集成电路、人工智能等 [2] 财务业绩表现 - 2025年1月-9月实现营业收入94.90亿元,同比增长54.65% [2] - 2025年1月-9月实现归母净利润19.61亿元,同比增长28.56% [2] - A股上市后累计派现7.43亿元 [3] 股东结构变化 - 截至9月30日股东户数为12.75万,较上期增加59.34% [2] - 截至9月30日人均流通股为18230股,较上期增加64.54% [2] - 香港中央结算有限公司为第八大流通股东,持股5275.03万股,较上期减少2037.64万股 [3] - 易方达上证科创板50ETF(588080)为第九大流通股东,持股3176.17万股,较上期减少673.53万股 [3] - 华夏上证科创板50成份ETF(588000)为第十大流通股东,持股3104.20万股,较上期减少1942.56万股 [3] - 嘉实上证科创板芯片ETF(588200)、华夏上证50ETF(510050)、华泰柏瑞沪深300ETF(510300)退出十大流通股东之列 [3]
硬科技翻红!海光信息涨超1%,科创芯片50ETF(588750)V型翻红,回调砸出“黄金坑”?多只科创芯片类ETF获批!谷歌:每6个月将算力容量翻倍
搜狐财经· 2025-11-24 03:05
市场表现 - 11月24日A股硬科技板块走势分化,科创芯片50ETF早盘走出V字型态势,探底回升后涨0.14% [1] - 指数成分股涨跌不一,天岳先进领涨超6%,安集科技一度涨超3%,峰岹科技涨超3%,海光信息涨超1%,中微公司飘红 [3] - 成分股中芯原股份、华虹公司一度跌超4%后跌幅收窄,中芯国际跌逾2%,拓荆科技、源杰科技跌超1% [3] - 前十大成分股中,中科蓝讯跌5.63%,东微股份跌5.12%,芯原股份跌2.84%,中芯国际跌2.65% [4] 资本市场动态 - 摩尔线程于11月24日正式启动科创板IPO申购,发行价114.28元/股成为年内最贵新股,募资总额约80亿元位列科创板新股第一 [5] - 11月21日14只硬科技ETF同日获批,包括3只科创板芯片ETF,标志着芯片主题ETF进一步扩容 [5] AI与算力行业趋势 - 谷歌于11月19日正式发布人工智能模型Gemini 3,其Gemini 3 Pro登顶LMArena大模型排行榜 [6] - 谷歌云AI基础设施负责人表示公司必须每6个月将算力容量翻倍,未来4到5年总体目标是实现1000倍能力提升 [6] - 海外闭源大模型性能角逐明显提速,国产大模型性能处于全球第一梯队,将推动大模型应用落地普及 [7] - 大模型应用落地普及将带来对AI算力在训练端及推理端的持续旺盛需求,拉动AI算力市场高景气 [7] 半导体行业展望 - 2025年全球半导体增长延续乐观走势,AI驱动下游增长,国产替代持续推进 [7] - 存储板块预估4Q25存储器合约价涨幅持续高增,企业级产品推进带动龙头公司季度业绩环比增长明确 [7] - 功率模拟板块市场复苏信号已现,3季度业绩增速喜人,晶圆代工龙头开启涨价,4季度预期稼动率持续饱满 [8] - 端侧AI SoC芯片公司受益于端侧AI硬件渗透率释放,ASIC公司收入增速逐步体现,设备材料板块头部厂商2025Q3业绩表现亮眼 [9] 科创芯片指数特征 - 指数选样空间为科创板,近3年来超九成数量的芯片上市公司选择在科创板上市,平均市值占比达到96% [10] - 指数行业分布聚焦芯片上游中游高精尖环节,核心环节占比高达96%,高于其他指数 [11] - 指数采用季度调仓,能更敏捷地反映芯片产业链发展趋势 [12] - 指数2025年前三季度净利润增速高达94%,全年预计归母净利润增速高达100% [14] - 指数自9月24日至今最大涨幅高达187.69%,向上修复弹性在同行业指数中更强 [14]
北方华创、南大光电等设备材料股走强!半导体设备ETF(561980)盘中涨超1%、连续7日“吸金”累计3.77亿
21世纪经济报道· 2025-11-24 02:24
市场表现与资金流向 - 11月24日三大指数高开低走,AI硬件板块活跃,上游半导体设备及材料股走强,天岳先进涨4.77%,晶瑞电材、北方华创、南大光电等涨超3% [1] - 半导体设备ETF(561980)早盘高开,盘中涨超1%,上周五回调期间获资金逆势买入,实现单日资金净流入近7500万元 [1] - 半导体设备ETF(561980)连续7个交易日获资金净流入,累计流入3.77亿元,年内份额大增108.8%,最新规模27.37亿元 [1] 行业指数与历史表现 - 截至11月21日,半导体设备ETF跟踪的中证半导指数年内上涨43.72%,在31个申万一级行业中仅次于有色金属和通信 [1] - 从历史日历效应看,2012年至今科技板块跨年超额特征明确,四季度易相对跑输,但跨年期间及次年初表现较好,震荡期或是布局科技跨年行情的窗口 [1] 行业驱动因素与前景 - 中美两国头部互联网厂商资本开支预计保持较快增长,Trendforce上修其今明两年资本支出预期,2025年达4306亿美元(增长65%),2026年达6020亿美元(增长40%),支撑未来算力芯片需求 [2] - 国内存储厂为明年晶圆厂资本支出贡献主要增量,预计带动半导体设备和材料需求 [2] - 半导体设备板块处于高速成长期中早阶段,受自主可控政策支持及AI等新兴应用驱动,晶圆厂扩产规划积极,为国内设备企业提供内生增长动力 [3] - 存储器涨价和缺货现象明显,存储板块明年资本开支需求向好,有望拉动刻蚀、薄膜沉积、先进封装等设备需求 [3] - 未来三年半导体自主可控有望大幅提升,行业增速保持高位,下游晶圆厂持续扩产为国内半导体设备和材料厂商提供广阔成长空间 [3] 指数构成与行业聚焦 - 半导体设备ETF(561980)跟踪中证半导指数,聚焦芯片产业链上中游公司,前十大成分股占比超78% [4] - 从申万三级行业看,半导体设备、半导体材料、集成电路制造三个行业占比超72%,均为国产创新关键环节 [4]
海光信息(688041):首次授予激励对象 产业链合作深化
新浪财经· 2025-11-24 00:30
股权激励计划 - 公司于2025年11月21日向878名激励对象首次授予1653.54万股限制性股票,授予价格为90.25元/股,约占公司总股本的0.71% [1] - 激励对象占公司截至2025年6月30日员工总数2803人的比例超过30%,授予范围广泛,旨在深度绑定员工并巩固核心人才壁垒 [1] 产业链合作与技术发展 - 公司与信安世纪共建AI密算联合实验室,将密码技术深度嵌入算力芯片底层,为AI应用提供内生安全能力 [2] - 公司与星环科技、海量数据签署战略合作协议,推进海光产品与数据库等关键软件的深度联合适配,并针对特定领域定制解决方案 [2] - 中科曙光发布scaleX640超节点,采用算、存、网、电、冷一体化紧耦合设计,实现单机柜640卡超高速互连,可使MoE万亿参数大模型训练推理场景性能提升30%-40% [2] 财务业绩预测 - 预计公司2025年至2027年收入分别为142.1亿元、207.0亿元、291.5亿元,同比增速分别为55%、46%、41% [3] - 预计公司2025年至2027年归属母公司股东的净利润分别为29.8亿元、43.4亿元、64.1亿元,对应市盈率估值分别为161倍、111倍、75倍 [3]
计算机周观点第 25 期:算力、模型、应用协同深化,AI 叙事迈向奇点关键期-20251123
国泰海通证券· 2025-11-23 12:17
行业投资评级 - 对计算机板块维持“增持”评级 [4] 核心观点 - 谷歌实现多模态技术突破,腾讯与杭州生态共推AI应用普惠,摩尔线程与宇树科技引领硬科技资产资本化,算力、模型、应用协同演进 [2][4] 全球AI技术进展 - 谷歌连续发布Gemini 3模型和Nano Banana Pro图像模型,在数学、推理和多模态理解测试中取得当前最优成绩,全面超越GPT-5.1和Claude Sonnet 4.5等主流竞争对手 [4] - Nano Banana Pro显著提升图像中的文本渲染准确度和物理世界认知能力,支持在复杂场景中保持多个角色一致性,能生成最高4K分辨率的专业级图像,并深度整合进Adobe、Figma等主流创意软件 [4] - 谷歌推出“Antigravity”智能体优先开发平台,旨在重塑开发者的AI辅助编程体验,标志着谷歌形成从基础大模型到专业应用工具的完整技术布局 [4] 中国AI应用生态 - 阿里巴巴于11月17日上线对标ChatGPT的“千问”App公测版,标志其AI战略从B端向C端拓展 [4] - 蚂蚁集团推出全模态通用AI助手“灵光”,支持在移动端通过自然语言30秒生成可交互的小应用 [4] - 腾讯混元大模型团队于11月21日开源轻量级视频生成模型HunyuanVideo 1.5,该模型基于DiT架构,凭借创新的SSTA稀疏注意力机制将推理显存需求大幅降至14GB,极大降低视频创作技术门槛 [4] - 杭州已形成覆盖文本、图像、视频及轻量级应用生成的完整AI应用生态 [4] 硬科技资本化进程 - 国产GPU企业摩尔线程以每股114.28元发行价启动IPO,预计募集资金总额达80亿元,将于11月24日正式申购,募资将重点投入新一代AI训练与推理芯片、图形处理器芯片的研发项目 [4] - 人形机器人领军企业宇树科技已完成上市辅导,计划在境内公开发行股票,其产品线覆盖四足机器人、人形机器人H2及灵巧机械臂 [4] - 两家企业的资本化进程标志中国在AI算力和机器人核心硬件领域进入产业化加速阶段 [4] 推荐标的 - 报告推荐标的包括:日联科技、金山办公、合合信息、海康威视、新大陆、道通科技、汉得信息、海光信息 [4] - 相关标的为:中科曙光 [4] - 提供了各推荐标的的收盘价、总市值、EPS及PE预测等详细数据 [5]
AI算力竞争转向,英伟达业绩亮眼,寒武纪营收大增近24倍
21世纪经济报道· 2025-11-22 01:47
英伟达业绩与市场反应 - 英伟达最新业绩发布后股价剧烈波动,财报发布当日一度涨超5%但最终收跌3.15%,其股价在11月以来已累计下跌近12% [1] - 股价波动反映市场对其未来增长可持续性的微妙预期,并受到外部环境不稳定不确定因素的影响 [3] 全球算力板块市场表现 - 美股科技板块承压下行冲击A股市场,11月21日算力概念板块较上一日下跌3.38%,资金净流出141.2亿元 [4] - 光模块企业新易盛、天孚通信、中际旭创分别收跌8.46%、7.34%和5.69%,AI芯片板块收跌4.33%且资金净流出16.85亿元 [4] - 电子和通信板块基金持仓超配比例已达历史高位,年末部分机构回笼资金导致短期获利盘了结压力加大 [4] AI算力需求与资本开支 - 微软、谷歌、Meta、亚马逊等科技巨头持续上调资本开支,为光模块、服务器等产业链带来确定性需求 [4] - 阿里计划三年内投资超3800亿元用于AI和云基础设施,其2025财年资本开支已达860亿元,而腾讯今年三季度资本开支同比下降24% [6] - 中国互联网公司更关注GPU效率和利用率,会根据需求变化更快速灵活地调整投入目标 [6] 国产算力生态进展 - 2025年中国AI服务器市场中外采芯片比例预计从2024年的63%降至42%,本土芯片供应商占比有望提升至40% [7] - 国产芯片厂商寒武纪今年前三季度营收46.07亿元,同比增长2386.38%,并实现归母净利润16.05亿元扭亏为盈 [7] - 海光信息前三季度营业总收入94.9亿元,同比增长54.65%,归母净利润19.61亿元,同比增长28.56% [7] 算力技术效率提升 - 大模型能力密度呈指数级增长,约每3.5个月翻一倍,意味着可用更少参数实现同等性能,效率优化成为新竞争焦点 [9] - GPT-3.5级模型API价格在20个月内下降266.7倍,约每2.5个月下降一倍,AI应用门槛快速降低 [9] - SpeedupLLM框架通过动态计算资源分配使LLM推理成本降低56%且准确率提升,算法优化提升硬件使用效率成为主流实践 [10] 产业链细分领域机会 - 光模块领域800G/1.6T高速产品成为主要增长点,中泰证券建议关注中际旭创、新易盛、剑桥科技等头部厂商 [13] - 光芯片上游EML、CW光芯片短缺为国产芯片带来导入机会,源杰科技、仕佳光子等厂商被看好 [13] - 中国液冷服务器市场2024-2029年复合增长率预计达46.8%,2029年市场规模将达162亿美元,液冷技术迎来行业拐点 [10][13]
2025年国产AI芯片软件生态白皮书
搜狐财经· 2025-11-21 20:17
行业背景与核心观点 - 在国际科技竞争背景下,国产AI芯片已形成多厂商、多技术路线并行的竞争格局,用户关注点从硬件算力转向软件生态的成熟度、兼容性与易用性,软件生态成为决定芯片价值释放与商业化落地的关键[1] - 国产AI芯片软件生态已从"基础可用"迈向"特定场景可用",形成"全栈生态"与"兼容生态"两大主流路径,行业协同与标准化建设初见成效,但在工具链完备性、生态成熟度及开发者规模上与国际主流仍有差距[1] - 未来需坚持"标准化、开源化、协同化"发展,通过产学研协同发力,推动国产AI芯片软件生态从"好用"向"卓越"跨越,筑牢自主可控的技术体系[1] AI芯片软件生态核心架构 - AI芯片软件生态由基础支撑层、核心工具层、框架适配层与管理监控层四层架构构成,各模块通过"技术依赖-功能协同"形成闭环,共同作用于AI模型的训练与推理过程[1][14] - 基础支撑层作为"翻译与调度中枢"负责硬件算力抽象与资源调度,主要包括芯片驱动、底层库和系统运行时等组件,相当于AI芯片的操作系统[1][17] - 核心工具层作为"性能优化引擎"涵盖编译器、算子库、通信库等优化工具,是让算力真正高效发挥的关键[1][20] - 框架适配层通过"国际主流框架+国产插件"与"国产自研框架+多硬件适配"两条路径降低开发者迁移成本[1][25] - 管理监控层提供监控与调度保障系统稳定运行,是系统稳定的"运维保障屏障"[1][31] 国产AI芯片分类及厂商生态 - 国产AI芯片可分为专用加速芯片(华为昇腾、寒武纪等)、通用计算型芯片(海光DCU等)、图形计算型芯片(摩尔线程、壁仞科技等)[1] - 代表性厂商生态各有侧重:华为昇腾构建全栈自主生态,摩尔线程以兼容CUDA降低迁移成本,寒武纪侧重推理场景优化,海光DCU适配"HPC+AI"融合负载[1] - 以华为昇腾、寒武纪、地平线、沐曦、燧原科技、海光信息、壁仞科技、摩尔线程及天数智芯等为代表的一批本土企业,已成功推出一系列具有市场竞争力的AI芯片产品,在国内市场形成了多厂商、多技术路线并行的活跃竞争格局[10] 基础支撑层技术实践 - 基础支撑层通过抽象硬件复杂性,让上层开发者无需直接处理寄存器、DMA等细节,例如摩尔线程的MUSA SDK提供了底层编译器和运行时库,屏蔽了GPU硬件细节[17] - 华为昇腾提供的CANN包含基础支撑层部分,封装了异腾AI处理器的指令集和算子,实现对硬件的抽象和使能,并已全面开源[17] - 寒武纪的NeuWare基础系统同时支持云端、边缘和终端各类芯片,提供统一的底层接口,方便智能应用在不同算力设备间迁移和调优[19] - 基础支撑层还需提供健康检测、故障隔离与版本兼容的能力,华为昇腾提供了npu-smi作为GPU信息查询接口,通过K8S设备插件等工具,上层调度器可感知AI芯片资源状态[19] 核心工具层技术实现 - 核心工具层涵盖模型编译器、算子库、性能分析和调优工具等,核心组成是AI编译器/执行引擎,负责将上层训练好的模型转换为适配芯片的高效执行方案[20] - 寒武纪的MagicMind推理加速引擎可将用户在PyTorch、TensorFlow等框架训练好的模型一键编译为思元芯片可执行的代码,内部集成了基于MLIR的图编译技术[22] - 高度优化的算子库和性能库提供基础数学运算和深度学习常用算子的实现,例如摩尔线程MUSA SDK包含muBLAS、muDNN等加速库,寒武纪的NeuWare提供CNNL以加速卷积、矩阵乘等算子运算[22] - 通信库是实现多芯片协同计算的关键工具,寒武纪NeuWare软件栈内置了CNCL通信库和Horovod分布式框架适配,摩尔线程MUSA SDK包含自研的MCCL,沐曦联合开源社区提供拓扑感知的通信方案[23][24] 框架适配层迁移路径 - 框架适配层通过扩展现有框架的设备类型和算子实现,让原有模型代码以极少改动跑在国产芯片上,典型做法是为框架增加新的设备标识(如npu、mlu、musa)[25] - 华为昇腾社区维护的torch npu仓库是面向Ascend NPU的PyTorch扩展,寒武纪提供CATCH/Torch-MLU等扩展,摩尔线程开源torch musa项目在PyTorch中新增MUSA设备类型[26] - 国产通用软件栈通过插件方式支持多家国产芯片,PaddlePaddle及其部署组件FastDeploy、PaddleX已支持在NVIDIA GPU、百度昆仑XPU、华为Ascend NPU、寒武纪MLU、海光DCU等多种硬件上无缝切换[27] - 国产自研框架如MindSpore+Ascend、MagicMind+MLU将框架执行后端与国产芯片紧密绑定,PaddlePaddle、计图等国产通用框架从设计之初就面向多家国产加速硬件[28][29] 管理监控层运维保障 - 管理监控层负责系统运行维护和资源管控,随着AI训练集群规模扩大,监控硬件状态并调度资源变得至关重要,成熟的算力生态配套完善的监控和调度系统[31] - 监控工具充当AI芯片运行状态的"实时感知载体",帮助运维人员和上层调度实时了解系统健康和性能状况,包括硬件层面的温度、电压、功耗、利用率等指标[33] - 国产AI集群将GPU或NPU的关键指标对接到现有运维平台,华为云ModelArts平台支持用户接入Prometheus来获取Ascend异腾集群的监控指标,沐曦开发mx-smi监控工具,寒武纪提供cambricon-smi[33] - 调度工具的核心任务是在多用户、多任务共享AI芯片集群的场景下合理分配硬件资源,提升集群吞吐,避免资源碎片,防止任务互相干扰,现代AI调度工具引入GPU切分共享、拓扑感知调度等创新机制[36]