Workflow
数据中心互联技术专题四:CSP云厂AI军备竞赛加速,智算中心架构快速发展
国信证券·2025-08-24 07:36

行业投资评级 - 投资评级:优于大市(维持评级)[1] 核心观点 - CSP云厂AI军备竞赛进入2.0时代,智算中心互联技术快速迭代[2] - AI芯片性能加速升级,带动光通信、铜连接、液冷等技术显著受益[3] - 全球CSP厂商资本开支大幅增长,海外四大厂商2025年合计Capex预计达3610亿美元(同比增超58%),国内三大厂商Capex有望超3600亿元[2] - 自研ASIC芯片成为CSP云厂发展核心,Google、AWS、Meta等头部厂商均布局自研算力集群[4] - 新技术如CPO、OCS、铜背板等快速发展,光模块/铜连接市场需求快速增长[5] CSP军备竞赛与AI算力基建 - AI大模型训练需求持续增长,多模态模型和AI agent推动token消耗量爆发式增长(如Google token用量从5月月均480e增至7月980e)[9][11] - 海外头部云厂商资本开支持续攀升,2025年Google Capex上调至850亿美元,Meta达660-720亿美元,微软FY2025达800亿美元[28] - 国内CSP厂商2025年Q1资本开支显著增长,阿里增126.7%,腾讯增91%[19] - CSP厂商加速自研ASIC芯片,如Google TPU、AWS Trainium、Meta MTIA等,推动算力集群定制化发展[29] 算力芯片厂商技术迭代 - 英伟达AI芯片架构迭代周期缩短至2年,网络连接速率从400G演进至1.6T[3][59] - 英伟达H200为主流产品,GB200 NVL72架构采用铜连接(GPU:400G DAC=1:36)和光模块(GPU:800G=1:1.5~2.5)[65][68] - 华为CloudeMatrix384超节点性能多项指标超越GB200,BF16算力达300 PLOPS(英伟达1.7倍),HBM带宽1229 TB/s(英伟达2.1倍)[90] - AMD计划2026年推出Helios AI集群,整合CPU+GPU+NIC实现生态闭环[82] CSP云厂自研芯片与数据中心网络 - Google自研TPU已至第七代(Ironwood),采用3D环面网络互联,机柜间使用OCS全光交换(TPU:400G光模块=1:1.5)[98][104][111] - AWS Trainium2机柜内互联以铜连接为主(Trainium2:400G DAC=1:9),2026年Trainium3将采用背板方案[115][120] - Meta Minerva架构基于自研MTIA-T芯片,机柜内采用铜连接(MTIA:800G DAC=1:12),Scale-out网络光模块配比达1:12[124] - 国内腾讯、阿里、字节等积极设计定制化数据中心架构,如腾讯ETH-X、阿里ALS项目[133][137] 新技术发展趋势 - 2025年全球800G光模块需求预计达4000万只,1.6T光模块超700万只[5][142] - CPO技术渗透率预计2029年达50%,OCS市场规模超16亿美元,PCIe Switch达50亿美元,DCI市场达284亿美元[5][188][189][195] - Scale-out方向CPO/OCS成为主流,Scale-up方向铜连接向正交背板演进[149][154][166] - OIO技术实现算力芯片光互联,MicroLED可能成为新光源[174][178] - 空芯光纤可降低传输时延30%,DCI技术向相干传输升级[182][184] 投资建议 - 推荐关注光模块厂商(中际旭创、新易盛、光迅科技、华工科技)、光器件厂商(天孚通信、长芯博创、太辰光、仕佳光子)、铜连接厂商(兆龙互联)及通信设备商(中兴通讯、紫光股份、锐捷网络)[5][202]