算力危机

搜索文档
挥刀中国,豪赌续命:Claude停服背后的算力危机 | Jinqiu Select
锦秋集· 2025-09-05 15:17
文章核心观点 - Anthropic暂停向中国用户提供Claude服务 表面是合规动作 实则反映其长期算力困境与战略收缩 通过关闭部分市场为欧美核心客户腾出资源 [1][2] - Anthropic在算力供给上捉襟见肘 Claude 4系列走红导致用户需求井喷 频繁触发额度收紧与服务降级 [2] - 生成式AI竞争已演变为算力供给 芯片路线 数据中心规模与资本布局的综合博弈 Anthropic的封禁动作和芯片豪赌都是算力危机推演出的应对策略 [3] - Anthropic押注亚马逊自研Trainium芯片 以近百万颗芯片级别的数据中心扩展换取增长 这一合作对AWS AI云业务具有长期意义 [3][20] - AI创业成败关键是在不确定性中找到生存解法 算力长期是AI创业最大瓶颈 无论大模型公司还是应用层创业者都可能受影响 [4] Anthropic算力困境与战略收缩 - Anthropic突然暂停向中国用户提供Claude服务 引发广泛关注 对开发者和企业意味被挡在全球头部大模型之外 [1] - 公司算力供给捉襟见肘 Claude 4系列走红导致用户需求井喷 频繁触发额度收紧与服务降级 [2] - 停服中国是算力吃紧下的被动收缩 通过关闭部分市场为欧美核心客户腾出有限资源 [2] - 生成式AI竞争是算力供给 芯片路线 数据中心规模与资本布局的综合博弈 [3] Anthropic与AWS的战略合作 - Anthropic押注亚马逊自研Trainium芯片 以近百万颗芯片级别的数据中心扩展换取增长 [3][20] - 2023年9月AWS向Anthropic投资12.5亿美元 可扩展至40亿美元 2024年3月合作扩大 Anthropic承诺使用Trainium和Inferentia芯片 [30] - 2024年11月亚马逊追加投资40亿美元 Anthropic将AWS指定为主要LLM训练合作伙伴 [30] - AWS为Anthropic准备的数据中心容量远超一千兆瓦 建设速度非凡 未来还有更多规划项目 [17][35] - 三个处于建设最后阶段的AWS园区拥有超过1.3GW的IT容量 唯一目的是服务Anthropic训练需求 [35] Trainium芯片的技术经济学逻辑 - Trainium2是全球最大的非英伟达AI芯片集群 最大园区将拥有近一百万颗Trainium2芯片 [20] - Trainium2在单位内存带宽的TCO优势完美契合Anthropic激进的强化学习路线图 [20][54] - Trainium2资本成本0.43美元/小时/GPU 运营成本0.23美元/小时/GPU 总拥有成本0.66美元/小时/GPU [21][53] - 在单位内存带宽TCO方面 Trainium2相比英伟达有30.1%优势 [21][53] - Trainium2理论BF16密集TFLOP/s/芯片为667 HBM容量13GB/芯片 HBM带宽2900GB/s/芯片 [48] - 虽然芯片规格落后 但单位内存带宽TCO优势使其具有竞争力 [49][50] AWS的AI云业务前景 - AWS贡献亚马逊集团约60%利润 但在GPU/XPU云时代难以将优势转化为竞争力 [12] - 微软Azure在季度新增云收入方面领先市场 谷歌云与AWS差距显著缩小 [12] - SemiAnalysis预测AWS人工智能业务将迎来复兴 到2025年底年同比增长率加速超过20% [14] - Anthropic在2025年生成式AI市场表现突出 收入增长五倍 年化收入达50亿美元 [18][31] - AWS三个大型园区将在2025年底为营收做出重要贡献 将增长率推高至20%以上 [38] 芯片技术路线比较 - Trainium2在纵向扩展网络使用NeuronLinkv3 带宽512GB/s/芯片单向 [48] - 新系统架构Teton PDS和Teton Max引入NeuronLinkv3全互联纵向扩展网络 [57] - Trainium架构正向英伟达NVL72 NVLink靠拢 四个NeuronLinkv3交换机托盘放置在机架中间 [57] - 英伟达GB200 NVL72在整个World Size拥有总计576TB/s内存带宽 Trainium2 Teton2-PD-Ultra-3L为186TB/s 差距3.1倍 [52] - 英伟达GB200在FP16浮点运算性能上具有3.85倍优势 内存带宽差距2.75倍 [51] Anthropic的扩张与融资 - Anthropic以1830亿美元估值进行约130亿美元融资 为其提供与AWS 谷歌等签署额外协议的资金 [40] - 公司不仅成为Trainium2唯一大型外部最终用户 规模也显著超过亚马逊内部需求 [54] - Anthropic深度参与所有Trainium设计决策 将Annapurna Labs当作定制芯片合作伙伴 [54] - 这使得Anthropic与Google DeepMind成为唯二受益于紧密软硬件协同设计的AI实验室 [20][54] - Anthropic在2026年的TPU扩张规模巨大 交易具有独特性 [58]