Workflow
微软Maia
icon
搜索文档
群狼围上来了,黄仁勋最大的竞争对手来了
虎嗅APP· 2025-12-12 09:32
美国政府批准英伟达对华销售H200芯片 - 美国政府正式批准英伟达向中国及其他“经批准的客户”出售高端H200 GPU芯片,但需缴纳25%的销售提成,此比例同样适用于AMD、英特尔等其他美国芯片巨头[4] - 英伟达最新的Blackwell和未来的Rubin系列GPU仍被禁止出口[4] - 此举是英伟达首席执行官黄仁勋长达数月游说的结果,受此利好消息推动,英伟达股价盘后上涨[4] - 过去两年,受美国芯片禁运令限制,英伟达逐步失去迅猛增长的中国市场,丢掉了在AI GPU市场原先高达95%的份额,其数据中心业务在中国市场的营收占比也从原先的四分之一急剧下滑[4] - 黄仁勋曾公开抱怨公司在中国市场“完全出局,市场份额已经归零”,而中国AI GPU市场今年规模估计高达200亿-300亿美元,因此即使缴纳25%提成,重新进入该市场对英伟达业绩意义重大[5] 英伟达的市场地位与潜在风险 - 英伟达是生成式AI时代的领军公司,在AI芯片这个万亿级赛道中,以压倒性的性能优势和CUDA平台优势占据主导地位,其GPU产品线几乎垄断了八成以上的市场份额[5] - 公司是全球最具价值的上市公司之一,市值一度突破5万亿美元[5] - 英伟达数据中心业务营收高达1300亿美元(最近财年),但存在客户集中度过高的巨大隐患:前两大客户营收占比39%,前三大客户营收占比高达53%[5] - 据媒体猜测,前五大客户为微软、谷歌、亚马逊、Meta和甲骨文,而前三大巨头(微软、谷歌、亚马逊)正在加速转用自研芯片,这直接威胁英伟达的订单和市场份额[6] 亚马逊AWS的自研芯片战略 - 亚马逊AWS在re:Invent大会上发布了新一代自研AI芯片Trainium 3,被媒体誉为“对英伟达的直接宣战”[7][8] - Trainium 3是亚马逊自2022年以来的第三代AI芯片,主打低成本与推理优势,训练速度比前代快4倍,成本减半[8] - 与英伟达相当的GPU系统相比,Trainium 3可节省50%训练费用,现场演示显示其在Llama 3.1训练中,仅需24小时完成相当于H100集群一周的任务[8] - AWS计划用自研芯片、自研模型、私有化部署及智能体全家桶,覆盖从训练到推理的整条AI赛道[9] - AWS在云计算市场保持巨大领先,市场份额超过三成,排名二三位的微软与谷歌市场份额分别为20%与16%[9] - OpenAI宣布与AWS签署七年价值380亿美元的AI基础设施服务协议,Anthropic等AI初创公司已转向Trainium,节省了超过三成的预算[9] 谷歌TPU的进展与市场威胁 - 谷歌是行业最早自研芯片的巨头,其第一代TPU于2016年发布,最新发布的第七代TPU v7 Ironwood进一步给英伟达带来压力[10][11] - Ironwood单芯片FP8计算能力达4.6 PFLOPS,比第五代TPU提升10倍,是第六代TPU的4倍,专为“高吞吐、低延迟”推理优化[11] - 相比英伟达Blackwell,Ironwood在能效上领先20%,功耗仅300W/芯片[11] - 2025年,谷歌的AI芯片市场份额预计已达到8%,尤其在占AI算力80%的推理领域[12] - 谷歌声称使用TPU可将训练成本降低40%,并已吸引Meta作为第三方客户,Meta计划在2027年部署谷歌TPU,而Meta正是英伟达AI芯片的第四大客户[12] - 谷歌Ironwood服务器将交由富士康代工[12] 微软自研芯片的挑战与延误 - 相比亚马逊和谷歌,微软在自研芯片领域遭遇挫折,其首代Maia 100芯片于2024年推出并开始部署,但原计划今年发布的Maia 200的大规模量产已推迟至2026年[13][14] - Maia 100是微软与博通合作开发的芯片,预计比英伟达H100芯片成本低40%,未来三代计划覆盖训练、推理和边缘[14] - 微软CTO表示公司未来将“主要使用自家芯片”,以减少对英伟达的严重依赖,但Maia 200的量产延误主要由于设计变更、仿真不稳定等技术内部因素以及台积电的产能瓶颈[15] - 由于在台积电抢不到先进制程产能,微软转向英特尔的18A节点计划在明年实现量产,如果Maia二代不能及时部署,微软明年可能还要投入100亿美元购买英伟达芯片[16] 性能与成本的竞争格局 - 英伟达在性能技术上仍具核心优势,其Blackwell架构B200 GPU单芯片FP8计算能力达20 PFLOPS,比前代H100提升4倍,在推理任务中能效比谷歌TPU高出30%[17][18] - 英伟达的CUDA平台支持4000多个AI框架和库,拥有庞大的开发者生态,是其真正的护城河[18] - 成本是AI巨头自研芯片的最大卖点:亚马逊Trainium3宣称可将训练成本降至前代的50%,谷歌Ironwood TPU在推理任务中能效比英伟达H100高出20-30%[19] - AI巨头正通过软件生态蚕食英伟达优势:谷歌的JAX和PyTorch/XLA集成已覆盖70% AI工作负载,AWS Neuron SDK支持主流开源模型,微软DirectML无缝嵌入Visual Studio[19] - 亚马逊计划在Trainium4上集成NVLink兼容技术,预计训练费用再降40%,谷歌TPU v8计划于2027年商用,成本优势或达50%以上[19] 自研芯片的市场份额展望 - 亚马逊的目标是在明年达到50%的自研芯片占比,推动AWS在AI云市场的份额从31%升至35%[20][21] - 谷歌TPU的市场份额已攀升至8%,其外部销售占比已达到20%,随着2027年Meta转用TPU,将给英伟达带来更大竞争压力[21] - AI大模型公司如Anthropic正在推动芯片多元化,同时使用多家芯片而非仅依赖英伟达,Anthropic与谷歌签署了价值数百亿美元的协议,计划使用多达100万片TPU[21] - AMD CEO苏姿丰评价认为,未来五年内,GPU仍将占据市场大部分份额,但给ASIC类加速器(即三大巨头的自研芯片)留出20%–25%的市场份额是合理的[22] - 苏姿丰还计划AMD在未来3-5年抢到两位数的市场份额[22]