Workflow
AI全栈式创新
icon
搜索文档
一文读懂“谷歌链”:AI全栈式创新,TPU+OCS共塑下一代智算网络
美股IPO· 2025-11-25 10:17
文章核心观点 - 谷歌通过深度整合自研TPU芯片与OCS光交换技术,构建了从芯片到应用的“全栈式”AI算力护城河,确立了下一代智算网络的架构标准 [1][3] - OCS技术通过物理光路直接传输数据,突破传统数据中心能效与扩展瓶颈,带来吞吐量提升和功耗成本降低等显著优势 [1][11][13] - 谷歌的技术革新驱动了上游光模块、MEMS芯片、光器件等产业链的增量需求,AI数据中心正向动态光子互联演进 [3][6][19] 芯片(TPU)技术 - 谷歌自研TPU v7(Ironwood)性能实现质的飞跃,单芯片计算能力较上一代TPU v5p提升超过十倍,峰值带宽达7.4 TB/s [6] - TPU v7采用3D Torus拓扑结构,单集群规模可扩展至9216颗芯片,并开始配置1.6T光模块以匹配极高算力密度 [6] - 预计到2026年,谷歌TPU将成为全球自研ASIC市场主力,出货量远高于AWS Trainium或Microsoft Maia等竞品 [8] 网络(OCS)技术 - OCS技术本质是用物理光路直接传输数据,彻底抛弃“光—电—光”信号转换过程,解决大规模扩展带来的功耗与效率难题 [1][10][11] - 在Ironwood集群中,48台OCS交换机连接9216个TPU芯片,构建低延迟、高带宽的动态光子网络 [11] - 引入OCS后,谷歌网络吞吐量提升30%,功耗降低40%,网络宕机时间减少50倍,资本开支减少30% [13] 产业链影响 - 谷歌TPU v7与英伟达GB200共同拉动,预计2026年行业1.6T光模块需求有望上修至2000万只以上 [8] - 谷歌OCS采用基于MEMS的方案,其定制光模块内置环形器,使所需端口和光缆数量比传统架构减少40% [15][17] - OCS的核心光学元件(如MEMS阵列、准直器、2D透镜阵列)单机价值量极高,并探索液晶、压电陶瓷等新技术路径 [18] - 预计2024-2029年OCS市场将以28%的复合增速增长,行业迎来技术与需求双重爆发期 [19]
一文读懂“谷歌链”:AI全栈式创新,TPU+OCS共塑下一代智算网络
华尔街见闻· 2025-11-25 08:25
文章核心观点 - 谷歌通过整合自研TPU芯片与OCS光交换技术,构建从芯片到网络的“全栈式”AI算力护城河,推动AI数据中心架构向动态光子互联演进 [1][3] TPU v7 (Ironwood) 芯片进展 - 即将全面上市的TPU v7在性能上实现质的飞跃,单芯片计算能力较上一代TPU v5p提升超过十倍,峰值带宽达7.4 TB/s [4] - TPU v7集群采用3D Torus拓扑结构,单集群规模可扩展至9216颗芯片,并开始配置1.6T光模块 [4] - 供应链调研指出,2026年谷歌TPU将成为全球自研ASIC市场主力,出货量远高于AWS Trainium或Microsoft Maia等竞品 [6] - 受英伟达GB200与谷歌TPU v7双重拉动,2026年行业1.6T光模块需求有望上修至2000万只以上 [6] OCS光交换技术优势 - 谷歌大规模引入OCS旨在解决大规模扩展带来的功耗与效率难题,替代面临严重功耗散热问题和昂贵布线成本的传统电分组交换机 [8] - OCS通过物理光路直接传输数据,摒弃“光—电—光”转换过程,是实现服务器解耦、允许计算资源跨机架动态编排的关键 [8] - 采用OCS后,谷歌网络吞吐量提升30%,功耗降低40%,网络宕机时间减少50倍,资本开支减少30% [11] - 在Ironwood集群中,48台OCS交换机连接了9216个TPU芯片,构建低延迟、高带宽的动态光子网络 [8] OCS技术构成与产业链影响 - 谷歌主流的Palomar OCS基于MEMS方案,拥有136个光路通道,通过2D MEMS微镜阵列反射光信号实现毫秒级光路切换 [14] - 谷歌在光模块中内置环形器,实现单根光纤双向传输,使所需端口和光缆数量比传统胖树架构减少40% [15] - OCS创造了对MEMS阵列、准直器、2D透镜阵列等高价值精密光学元器件的需求 [15] - 除MEMS方案外,谷歌正在探索液晶、压电陶瓷和硅光波导等新技术路径 [15] - Lightcounting预测2024-2029年OCS市场将以28%的复合增速增长,行业迎来技术与需求双重爆发期 [17] 谷歌全栈AI布局 - 公司已形成从芯片(TPU)到网络(OCS)、模型(Gemini)、应用(云计算/搜索/广告)的全栈优势布局 [3] - 自2011年成立谷歌大脑实验室以来,通过一系列AI研究(如2017年发布Transformer架构)将AI整合到多元业务流程中,获取海量训练数据 [3]
证券研究报告、晨会聚焦-20251106
中泰证券· 2025-11-06 12:47
核心观点 - 报告核心观点为谷歌凭借其AI全栈式创新构筑了强大护城河,其自研TPU芯片与OCS光交换技术共同塑造下一代智算网络,并由此带来相关产业链的投资机会 [3][5] 谷歌AI全栈优势与资本开支 - 谷歌全面布局芯片(TPU)、网络(OCS)、模型(Gemini)及应用(云计算/搜索/广告等),形成AI全栈优势 [3] - 谷歌自研TPU芯片实现跨越式发展,Gemini模型能力全球领先 [3] - 谷歌2025年资本开支上调至910-930亿美元,其资本开支占营收及经营性现金流的比例相比其他云服务提供商具备提升潜力,预计2026年将继续加大资本投入 [3] - Gemini月活跃用户已超6.5亿,每月处理的Token总量在一年内增长超过20倍 [3] - 谷歌云营收及占比持续提高,在AI拉动下需求强劲且在手订单充足 [3] OCS光交换技术的优势与应用 - OCS(光电路交换机)利用光信号直接传输数据,避免了信号转换过程,能减少延迟和能量消耗,尤其在大规模AI算力需求下表现出极大优势 [4] - 当ScaleOut规模呈指数级扩张时,传统Clos架构在功耗、散热、布线和资本开支方面面临挑战,OCS是应对动态算力需求的关键解决方案 [4] - 根据Drut,服务器解耦的技术核心是通过OCS动态光子fabric实现PCIe信号的长距离、低延迟传输,数据无需经过多跳交换机,效率显著提升 [4] - 在谷歌自研TPU集群架构中引入OCS替代脊交换机,使其整个网络吞吐量提升30%,功耗降低40%,数据流完成时间缩短10%,网络宕机时间减少50倍,且资本开支减少30% [5] - OCS主要包括MEMS、液晶、压电、硅光波导四种技术方案,其中MEMS和液晶方案应用进展较快 [5] - 英伟达等公司也在探索OCS应用,考虑到其性能优势,未来在数据中心应用前景广阔 [5] 谷歌TPU发展与硬件创新 - 谷歌早期数据中心使用Clos拓扑架构,后在自研TPU集群Jupiter/Apollo架构中引入OCS [5] - 谷歌TPU V7 Ironwood即将全面上市,并开始配置1.6T光模块 [5] - OCS的核心部件如MEMS阵列、光纤阵列、光模块等供应商有望受益于其发展 [5] 产业链投资建议 - 报告建议重视谷歌AI算力产业链和OCS技术创新带来的投资机会 [6] - 重点关注公司包括:中际旭创(谷歌光模块主供应商,推出硅光子OCS交换机)、长芯博创(谷歌链光器件供应商)、腾景科技(OCS产品种类多)、德科立(联合研发光波导方案OCS)、光库科技(具有OCS业务)、炬光科技(提供相关光学产品)、赛微电子(MEMS-OCS)、凌云光(压电陶瓷方案)、光迅科技(推出MEMS系列OCS产品) [6]