公司战略定位 - 公司全盘押注AI推理芯片市场,选择在推理芯片上进行单点突破,以缩短与英伟达的距离 [2] - 公司认为模型训练和推理在计算精度、内存架构等方面存在较大区别,一颗芯片难以兼顾训练效能与推理的经济性 [2] - 公司脱胎于商汤的芯片业务部门,于2024年底独立并完成第一轮外部融资,2025年7月宣布完成近10亿元的新一轮融资 [2] 产品与技术路线 - 公司已推出三代推理芯片:第一代S1芯片于2020年量产,累计销售超2万颗;第二代S2芯片从2024年9月起量产,实测性能接近英伟达A100的80%;第三代S3芯片于2025年5月立项,预计2026年点亮 [3] - 第三代S3芯片针对大模型推理定制优化,支持FP8和FP4低精度数据格式,将配置200G以上的显存及足够带宽,目标是在大模型推理部署成本上接近英伟达下一代Rubin架构芯片 [3] 市场环境与行业趋势 - 相较于训练芯片,推理芯片的设计难度和数据处理规模相对较低,成为众多国产AI芯片公司的竞争焦点 [4] - 随着预训练模型成熟和智能体及下游应用爆发,行业预见推理算力需求将在未来数年占据上风,进入“大模型下半场” [4] - AI芯片范式正向高性价比推理芯片变迁,高性能训练芯片市场发展空间小,而高性价比推理芯片是市场蓝海 [4] 商业化与生态策略 - 公司选择兼容英伟达的CUDA并行计算框架,以降低客户迁移成本 [5] - 公司通过资本投融资及深度业务合作,紧密绑定上下游企业,确保芯片从设计第一天起就有客户,从而获得反馈提高易用性 [5] - 公司背后的产业资本包括三一集团、第四范式、美的控股、游族网络等,并与商汤科技、世纪互联、超云、硅基流动等建立合作 [5] - 在优化推理芯片性价比方面,关键在于取得算力与显存带宽之间的平衡,避免在推理任务中浪费算力或带宽 [5]
商汤分拆的AI芯片公司,为何全盘押注模型推理市场?