Workflow
训推分离
icon
搜索文档
国产AI芯片告别“草莽时代”
财联社· 2025-12-30 01:35
文章核心观点 - 2025年国产AI芯片行业经历了“成年礼”,多家公司成功上市,产业从“概念公司”阶段迈向“产品公司”阶段,具备了实际交付与规模部署能力 [1] - 行业竞争焦点因国产大模型爆发和“训推分离”共识而发生深刻变化,从单纯比拼硬件参数转向软硬件协同与场景落地能力的较量 [5][6][9] - 2026年行业竞争将进入“工业化比赛”的下半场,推理侧规模化落地、整体解决方案能力以及资本市场叙事分化将成为关键 [8][9][10] 资本热潮与产业阶段 - 2025年国产AI芯片产业迎来“成年礼”,摩尔线程-U、沐曦股份-U在科创板上市,壁仞科技、天数智芯加速冲刺港股 [1] - 行业在推理计算、特定模型适配及软硬件协同方面已具备实际交付与规模部署能力,能够满足部分行业客户核心需求 [1] - 科创板因其制度与风险偏好,成为承接高研发投入、短期亏损但具备战略属性算力企业的重要平台 [1] 竞争格局与外部挑战 - 2025年并非传统龙头地位被撼动之年,而是市场被“拉长”之年,以英伟达为代表的高端训练芯片依然不可替代 [2] - 国产企业通过“堆面积、堆晶体管、堆芯片”方式弥补单卡性能差距,但能效比和软件生态短板依然明显 [2] - 2025年12月,美国允许英伟达向中国出口H200芯片(加收25%费用),其性能介于最先进的Blackwell系列与“中国版”H20之间,对H20领先5到10倍不等,被产业界视为“温水煮青蛙”式的倾销策略 [3] - 竞争格局正从单一龙头垄断演变为多层级并存,围绕推理算力、行业定制和国产替代的多个细分赛道正在形成 [4] - H200的入局未撼动国产算力在政务、运营商、金融等领域的“基本盘”,供应链安全与可控已成为比性能更硬的指标 [4] 软件定义硬件与产业分化 - DeepSeek等国产大模型的爆发给硬件厂商“上了一课”,其采用的UE8M0 FP8量化策略是针对下一代国产芯片设计的机制,标志着软件开始反向定义硬件 [5] - DeepSeek的成功表明,通过模型压缩、稀疏计算、混合精度训练等技术可在一定程度上弥补硬件性能不足 [5] - 许多芯片标称算力高,但因不支持混合精度训练、高效互联,在实际大模型训练中效率极低 [6] - DeepSeek让MoE、混合精度、高效互联等技术成为必须,对国产GPU厂商综合软硬件设计能力提出更高要求 [6] - 行业从“大乱炖”剧烈分化为两个方向:奉行“大力出奇迹”的训练侧(如壁仞、摩尔线程)和信仰“精打细算”的推理侧(如华为昇腾、云天励飞-U、寒武纪-U) [6] - 训练侧比拼多机多卡集群能力与软件栈;推理侧比拼单位业务成本、稳定性与易迁移性 [6][7] 2026年发展趋势与竞争焦点 - 2026年共识是做好训练是巨头“游戏”,做好推理才能为国产AI芯片带来更多落地可能性 [8] - 全球算力竞争重心变化,英伟达与Groq交易、谷歌发布TPU Ironwood释放强烈信号,推理成为决定AI应用规模化落地关键 [8] - 驱动力是“训推分离”,智能体应用兴起使得推理成为包含规划、检索、调用的持续流程,企业最关心单位业务成本和服务质量 [9] - 推理赛道场景分散、需求多样,是中国厂商实现“弯道超车”的窗口期 [9] - 2026年推理算力增长速度将明显快于训练算力 [10] - 竞争焦点一:推理规模化,比拼谁能提供更低成本、更稳软件栈的方案以拿下政务、金融、工业等“大粮仓” [10] - 竞争焦点二:客户需求由“买芯片”向“买算力服务”转变,未来竞争是“芯片+系统+软件”的整体较量 [10] - HBM、铜缆互联、先进封装等“周边配套”的稳定供应与交付将从加分项变成入场券 [10] - 资本市场概念出现分流:A股科创板继续承接以通用GPU为代表的“硬科技”叙事;港股成为以地平线机器人、黑芝麻智能为代表的“场景牵引型”芯片主阵地 [10] - 2026年是一场“工业化比赛”而非“单点技术秀”,分水岭在于能否将资本转化为真正的产业化份额与可持续现金流 [10][11]