行业与公司 * 纪要涉及的行业为云计算与人工智能算力行业 主要公司包括阿里巴巴 字节跳动 腾讯 华为 以及国产GPU供应商如平头哥 海光 寒武纪等[1] * 阿里巴巴的资本开支计划是三年3800亿人民币 2024年和2025年的计划分别为1200亿人民币[2] * 字节跳动在2024年拥有接近40万张1X2 GPU 预计2025年H20 GPU数量可达50万张左右 并向寒武纪订购了超过10万张[3][25] * 腾讯去年采购了约20万张H20 GPU 并订购了约10万张AMD MI 3080 GPU[25] 资本开支与算力投资规划 * 字节跳动计划2025年将60%的资本开支用于海外算力储备 40%用于国内[1][3] * 阿里巴巴则主要投资于国内 但预计2026年海外投资比例将增至三分之二[1][4] * 资本开支呈现稳中有升的趋势 GPU和算力的占比持续增长[2] * 2025年国内无法正常采购英伟达的H20卡 因此各大厂商正在调整策略 加大国产卡的采购规模[2] 算力设备采购与库存 * 海外市场主要采购高端英伟达系列卡(如GB200)用于复杂模型训练[1][5] * 国内市场则侧重于垂直模型训练和推理业务 并逐渐向国产化转移[1][6] * 国内云厂商主要采购海光 海五记和平头哥三家的国产卡[1][15] * 自有PPU现有约3万张 加上其他如寒光800等 总计约10万张[1][15] * 英伟达系显卡总量达到五六十万张 具体包括H20约31万张 H800约3万张 H100约4万张 A800约5.5万张 A100约8000张[9][10] * 在海外还有2万张左右的G200 并持续采购[9] 国产GPU发展 * 2026年国产GPU卡的采购比例预计将达到60%以上[1][22] * 制定高比例的原因在于难以通过正常途径购买英伟达卡[1][23] * 国产PPU卡介于A800和H20之间 实际参数接近A800 更适合推理集群补充及低成本AI应用迁移[20] * 海光DPU 3单卡性能优于590和PPU 并且更好兼容CUDA生态 但价格较高[15] * 华为主要使用升腾芯片 字节跳动则采用寒武纪加升腾模式[2] * 阿里巴巴从未考虑过采纳华为产品[17][18] * 国产卡在推理端短期内将逐步转型为主要选择[15] * 核心问题在于产能及大客户保障能力不足 中芯国际每月的产能仅为数万片[22][24] 算力需求与应用 * 通义系列模型在国内处于领先地位 模型种类齐全 文本类模型表现最佳[3][29] * 日均消耗Tokens约为3万亿 每月环比增长达到两位数 预计到年底日均消耗将达到4.5万亿次左右[3][30] * 显卡用途分为内部使用和外部商业化使用 内部使用(阿里集团 不包括蚂蚁集团)占1/3 阿里云及达摩院自用占20% 商业化用途占50%[14] * 商业化用途中实际使用率约30% 从功能上看 训推比例大致为50%用于训练 50%用于推理[11] * 业务增量很大程度上来源于中国企业出海 对算力需求增加[5] 风险与挑战 * 由于政策因素 2025年国内无法正常采购英伟达的H20卡[2] * 海外数据清洗和模型训练确实存在一定的限制 主要涉及监管和合规问题[7] * 在海外进行模型训练会增加成本和训练时长 由于数据集中投喂以及同步过程中的差异 海外集群的效果与国内相比有一定差距[8] * 国产GPU卡采购比例目标可能难以完全实现 由于产能问题[22] * 不同品牌混用会导致维护成本过高[24] 其他重要内容 * 阿里巴巴在超级计算节点方案上的进度相对较慢 超节点方案主要由平头哥生产 并与达摩院和阿里云协同运作[1][21] * 以租代买形式下游租赁公司的利润空间通常在10个点以内[32] * 公司高度重视商业化布局 但目前采取保守策略 通过点对点合作打标杆案例[33] * PPU的商业化困难 用户在选择计算卡时通常优先考虑英伟达 除非有政策要求[34] * 当前PPU单卡成本价约为4万元左右[36] * 液冷技术在国内几个大的IDC已经接入 占据较大比例 是一种趋势[37]
算力需求专题解读
2025-09-24 09:35