AI 模型训练
搜索文档
算力产业需求专题解读
2025-12-08 00:41
涉及的行业与公司 * **行业**:算力产业、人工智能芯片与服务器、云计算[1] * **公司**:阿里巴巴、字节跳动、腾讯、英伟达、谷歌、寒武纪等[1][2][3] 核心观点与论据 资本开支与投资趋势 * 2025年,字节跳动资本开支预计1600亿元,但国内部分仅达成预期的40%左右,战略聚焦算力卡,国内外投资占比约为6:4[2] * 2025年,阿里巴巴资本开支约1100亿元,腾讯约900亿元,均与年初预期持平[2] * 2026年,阿里巴巴海外算力投资预计增长60%,字节跳动预计增长200%,腾讯预计增长10%[1][5] * 未来五年,公司在算力方面的投资将保持持续正增长[1][9] * 若训练效能提升,达到市场稳态的时间可能从五年缩短至两到三年[9] 算力采购与存量 * 2025年,阿里巴巴在国内采购约22万张8卡服务器(去年为35万张),腾讯采购近20万张8卡服务器[3] * 阿里巴巴和字节跳动的GPU卡数量分别达到约26万张和20万张[1][9] * 为满足深度训练需求,预计至少需要10万个GPU卡集群(即10万张卡)[1][9] * 国内存量卡方面:字节跳动总量约50万张(英伟达卡36-40万张),阿里巴巴总量约40万张(国产卡与英伟达卡比例约3.5:6.5),腾讯总量约25-30万张(国产卡约10万张)[20] * 海外存量卡方面:字节跳动约25万张,阿里巴巴约10万张,腾讯约3万张[20] 应用场景分配与需求 * 阿里巴巴:云业务占整体算力的15%左右,推理占60%左右,训练占25%左右[7] * 腾讯:云业务占20%,推理占50%,训练约30%[7] * 字节跳动:云业务(火山引擎)占比5%到10%,推理约40%,训练50%[7] * 预计三年内推理需求将形成主导地位[1][7] * 以阿里巴巴为例,推理总需求量至少需要50万张GPU卡[10] 国产芯片应用与替代 * 国产芯片在大厂中的应用比例逐渐增加,但主要集中于推理领域,在训练领域尚未完全取代H20或A100等高端GPU卡[3][12] * 国产芯片如910B系列可以替代英伟达S20约80%至90%的效能,但在兼容性和生态系统方面仍有差距[3][11] * 各公司正在测试不同的国产芯片以匹配业务场景[3][12] * 自研芯片(如字节跳动、阿里巴巴)主要用于应对外部供应链风险,为核心业务提供保障,但增速远低于专业厂商[14] 海外布局与数据安全 * 公司在海外进行AI模型训练时,遵循属地国家的数据合规要求(如新加坡要求高于马来西亚和泰国)[1][8] * 通过将训练场景与自身应用结合(如阿里以农产品电商服务名义)进行包装[8] * 数据安全问题通过两种方式解决:一是形成产品化后再输向国内;二是通过技术手段加工后,经香港进入国内[8] 市场竞争与供应链 * GPU市场仍由英伟达主导,其GPU排期已到2027年[17] * 谷歌的TPU作为替代产品开始对外销售,但未来两年内GPU仍将占据主导地位[3][17] * 目前通过一些灰色渠道获取高端算力卡以满足局部需求[6] * 若能解决高端算力卡供应问题,且国产替代品性能提升,将推动公司加大投入[6] 其他重要内容 * 海外投资布局:阿里巴巴和字节跳动重点布局东南亚、日本;字节跳动还扩展至芬兰和巴西;腾讯集中在东南亚、印尼和越南市场[1][5] * 阿里巴巴数据中心总容量达700兆瓦,今年新增250兆瓦(较去年减少)[2] * 海外投资规模:阿里巴巴预计达400亿元,字节跳动约600亿元,腾讯约250亿元[4] * 超节点产品存在兼容性问题,主要用于新业务场景的小规模试点,而非替代现有业务[13] * 国内市场规模及发展潜力可观,若外部环境改善或国产卡性能与生态完善,国内投资增速可能超过国外[21]