谷歌TPU商业化与市场竞争 - 谷歌开始向小型云服务提供商出售TPU芯片 部署于数据中心 并与Fluidstack达成协议在纽约数据中心部署TPU [1] - 谷歌同时寻求与Crusoe及CoreWeave等英伟达核心服务商合作 [1] - 花旗分析师因TPU竞争加剧将英伟达目标价下调至200美元 预计2026年GPU销售额减少120亿美元 [2] TPU技术优势与设计特点 - TPU采用脉动阵列架构实现高矩阵乘法吞吐量 通过数据复用减少内存访问延迟 [4] - 采用提前编译策略实现能效优化 无需复杂缓存机制 [4] - TPU算力成本仅为OpenAI使用GPU成本的1/5 性能功耗比优于同代GPU [6] - 第七代TPU Ironwood峰值算力达4614 TFLOPs 内存带宽7.2 Tbps 每瓦算力29.3 TFLOPs [9] - Ironwood最高集群达9216芯片 峰值算力42.5 ExaFLOPS 为El Capitan超算的24倍 [9] TPU产品演进与出货规划 - 第一代TPU于2015年推出 专注于能效优化 [7] - v2版本引入BF16格式支持训练 构建256芯片互联的TPU Pod系统 [7] - v4采用光学电路交换技术实现网络拓扑动态重构 [7] - v5/v6系列分化为性能导向的p系列与能效导向的e系列 [7] - 2025年TPU总出货量预计250万片 其中v5e占120万片 v5p占70万片 [8] - v6系列2025年出货60万片 v6p将于第四季度上市10-20万片 [8] - 2026年总出货量预计超300万片 [8] 生态系统建设与行业认可 - 谷歌构建JAX高性能计算库及Pathway模型流水线解决方案支持TPU生态 [10] - 过去半年Google Cloud TPU开发者活跃度增长96% [11] - Anthropic招聘TPU内核工程师 xAI对采购TPU表现兴趣 [12] - 谷歌内部已部署约150万颗TPU 2024年订购英伟达GPU16.9万台 为微软三分之一 [12] 市场竞争格局与行业趋势 - 野村证券预计2026年ASIC出货量首次超越GPU [13] - Meta计划2025年第四季度推出ASIC芯片MTIA T-V1 目标出货量100-150万件 [15][16] - 微软亚马逊均布局自研ASIC芯片 [17] - 英伟达推出NVLink Fusion允许混合使用第三方加速器 声称GPU更具性价比 [17] - AI计算市场规模达万亿美元级别 [2][17]
这一战,谷歌准备了十年