文章核心观点 - 英伟达新一代Blackwell芯片及其后续产品预计将在2026年初开始重塑AI训练的成本结构,终结谷歌TPU当前的低成本优势,从而可能改变AI产业的竞争格局和经济模型 [1][6] 英伟达Blackwell芯片的进展与影响 - 从Hopper到Blackwell的过渡是科技史上最复杂的产品转型之一,数据中心机架重量从约1000磅增至3000磅,功耗从30千瓦跃升至130千瓦,冷却方式从风冷转为液冷 [2] - 由于上述技术挑战,Blackwell芯片直到最近三四个月才开始大规模部署,其延迟为谷歌创造了意外的优势窗口 [2] - 基于Blackwell训练的首批模型预计将在2026年初问世,预计将由xAI率先推出 [2] - xAI快速的部署速度帮助英伟达在一个数据中心内尽可能多地部署GPU以形成连贯集群,为所有客户排除故障,这种“连贯”集群通过scale-up网络和scale-out连接共享内存 [3] - 英伟达即将推出的GB 300芯片将具有“即插即用”的兼容性,能够直接替换现有GB 200机架,无需额外的基础设施改造,垂直整合的公司将成为新的低成本生产者 [3] - 在Ruben下一代芯片推出后,英伟达GPU与TPU及其他ASIC之间的性能差距预计将进一步扩大 [6] 谷歌TPU的成本优势与潜在挑战 - 谷歌凭借TPU芯片在AI训练领域占据了低成本优势,使其能够以负30%的利润率运营AI业务,有效“抽干AI生态系统的经济氧气” [1] - 谷歌将TPU的前端设计留给自己,但将后端设计外包给博通,后者从中收取50-55%的毛利率 [4] - 以2027年TPU业务规模约300亿美元估算,谷歌每年要向博通支付约150亿美元,而博通半导体部门的运营成本仅约50亿美元 [4] - 谷歌引入联发科作为第二供应商,被视为对博通的“警告”,联发科的毛利率远低于博通 [4] - 但这种供应商分化和外包策略导致谷歌在设计上更加保守,使TPU的发展速度难以跟上英伟达GPU的年度迭代节奏 [5] - 谷歌通过引入联发科作为第二供应商,可能进一步拖慢TPU的进化速度 [5] AI产业竞争格局的预期转变 - 一旦谷歌失去最低成本生产商地位,其以负利润率运营AI业务以压制竞争对手的战略将发生根本性改变 [6] - 当Blackwell集群转向推理应用并改变成本动态后,继续维持负30%的利润率对谷歌来说将变得“非常痛苦”,甚至可能影响其股价表现 [6] - 推理技术的突破在2024年中期至Gemini 3发布期间“拯救了AI”,在新一代芯片到来前填补了约18个月的空白期 [2] - 英伟达和AMD的策略是“每年推出一款GPU,让竞争对手无法跟上” [5]
科技投资大佬:明年英伟达GPU将颠覆谷歌TPU优势