谷歌挑战英伟达,摩尔线程、沐曦内部人士怎么看?
第一财经·2025-12-18 10:48

文章核心观点 - 谷歌发布新一代AI模型Gemini 3系列及其自研TPU,其展现的性能与成本优势对英伟达GPU的霸主地位构成挑战,引发资本市场震荡,英伟达市值一度蒸发超千亿美元 [1] - 核心议题在于AI时代硬件技术范式是否正从通用GPU转向专用芯片(如TPU),以及这是否意味着结构性变革 [1] - 中国GPU厂商代表(摩尔线程与沐曦)认为,通用GPU与专用芯片(ASIC/TPU)是“通才与专才”的分工,将长期共存,而非简单替代 [1][3] 行业技术路线与竞争格局 - 通用GPU的持续优势:其优势在于灵活度是“甜点”、多模态时代的全功能性(“图算一体”)、以及生态护城河(如CUDA)[1] - 专用芯片(如TPU)的应用场景:全栈整合公司(如谷歌)在自身算法收敛稳定后,为特定超大型服务定制专用芯片以实现成本效益最大化,但绝大部分企业不具备此垂直整合能力 [1][3] - 技术架构的稳态与选择:GPU和ASIC架构几十年前已存在,处于超级稳态;选择关键取决于应用场景,在大模型快速迭代(按周、按月计)且未收敛的当下,通用GPU的泛化能力和适配性仍是核心竞争力 [3] - 市场地位验证:华尔街将英伟达推上市值榜首,证明了通用性GPU在当前历史阶段的主流地位 [3] 中国AI算力厂商的战略与实践 - 摩尔线程的路线与生态:公司坚持研发全功能GPU“图算一体”能力以支持多模态和所有计算范式,并正在搭建自己的MUSA生态 [1][2] - 沐曦对产品本质的理解:认为AI基础设施的最大挑战在于提供可靠支持大规模模型训练、推理与服务的通用算力平台,而非孤立的单卡或服务器 [5] - 集群系统与网络互联的重要性:在AI大模型竞赛中,决胜关键并非单卡峰值算力,而是能连接成千上万张计算卡的高性能网络及与软件栈深度协同的集群系统 [4] 中国AI算力厂商的部署进展 - 摩尔线程的集群部署:公司已有多个投入生产的千卡集群在运行(非实验室),支持训练和推理,致力于提供端到端全栈解决方案 [4] - 沐曦的集群部署与训练成果:公司已在全国范围内部署了数千卡规模的集群,并成功完成了从传统模型到MoE(混合专家)模型乃至非Transformer架构模型的训练任务 [5]