华为Atlas 300I Duo

搜索文档
国产AI推理芯片的双重博弈:围攻4090,谁能卡位成功?
雷峰网· 2025-09-04 06:04
文章核心观点 - 信创市场是国产AI芯片最容易相遇的战场,但规模有限且进入门槛高[1][22] - 国产AI芯片公司正通过极致性价比和场景优化策略集体围攻英伟达4090,争夺边缘推理市场主导权[4][17][19] - 2025年AI推理市场将面临云-边-端协同格局的重构,国产芯片需通过生态合作实现场景落地[7][9][24] AI推理市场格局争议 - 业界对云-边-端协同方式存在分歧:一方认为边缘推理需求将下降,端侧小模型(10B以内)和云端主导未来[7];另一方认为端侧算力提升受功耗限制,边缘推理需求持续增长[8] - 大模型重新定义算力边界:单卡算力超100TOPS@TF32属边缘市场,10B以下模型归端侧市场[7] - 云天励飞提出云端推理占比提升,端侧需求待应用饱和后可能反弹[9] 泛安防市场现状 - 万亿级存量市场格局固化,华为、云天励飞、登临科技等公司已占据优势位置[11][12] - 设备更新周期延长(原5年现延至8年),智能摄像头渗透率仍低[12] - 新玩家需颠覆式创新才能突破,客户更关注资源极致利用和性价比升级[12][13] 新兴应用与芯片布局 - 生成式AI催生AI玩具/眼镜/戒指等新硬件,带来端侧芯片需求[14] - 老牌芯片公司专为7B模型设计芯片押注端侧赛道[15] - 70B以下模型边缘推理市场更受关注,成长性优于端侧[15] 国产芯片竞争策略 - 以极致性价比对标英伟达4090:128G显存加速卡售价约5000元,运行30B量化模型达20 token/s[17] - 通过大显存(128G对比4090的48G)和场景优化实现TCO优势,单台设备可替代8卡4090服务器[17] - 软件优化是关键:GPGPU架构缩短落地时间,专用架构通过算子优化可实现数倍性价比优势[18][19] 信创与行业落地 - 信创市场刚需以CPU为主,AI算力需求有限且受财政预算制约[22] - 医疗、能源、互联网头部企业及中小企业成为重点拓展领域[23] - 江原科技、沐曦、天数智芯通过PC加速卡等灵活形式降低信创市场成本[23] 生态合作与未来布局 - ISV(独立软件开发商)是规模化应用的关键,芯片公司需与ISV深度绑定实现从1到100的突破[24] - 2025年将发布全国产工艺AI芯片,大客户绑定能力决定市场地位[26] - 后摩智能聚焦消费终端/智能语音/运营商边缘计算三大赛道[24]