英伟达Ruby Ultra
搜索文档
如何理解Scale-up对光模块的通胀逻辑?
2025-12-25 02:43
涉及的行业与公司 * **行业**:光模块/光连接、AI网络互联、数据中心基础设施[1][4][5] * **公司**:英伟达(Ruby Ultra)、谷歌(I/O Superpod)、华为(Cloud Matrix)、阿里[1][4][5][9] 核心观点与论据 * **网络架构演进趋势**:AI网络互联正从**Scale Out**(负责复杂、长距离通信)向**Scale Up**(专注于高速、短距离的卡间互联)转变,这一转变推动了铜连接和正交板技术,并预示着未来将更多探讨柜内光连接方案[1][2][4] * **高密度机柜设计**:以**英伟达 Ruby Ultra**为代表,通过将576张卡拆分为4个144卡的机框,利用**正交板**和**铜线**星状连接实现内部互联,采用**Dragonfly网络架构**以优化层数、减少延时[1][6][7] * **超节点设计**:以**谷歌 I/O Superpod**为代表,采用低密度机柜(144个64卡机柜,共9,216张卡),通过光模块实现柜间**SKA**连接,使用**OCS**技术,提高了系统灵活性与性能[1][5][9] * **光连接替代铜连接趋势**:受散热、布线、承重等物理极限影响,高密度机柜内部互联未来从铜转向光的趋势明显增强,下一代产品(如**Freeman**)有望实现柜内全光设计[7][8] * **技术成本与性能比较**: * 成本:当前**硅光方案**ASP约**0.5美元/Gbps**,**EML方案**约**0.6美元/Gbps**;铜连接从DAC升级到AEC成本也会显著上升;**PCB正交板**成本低于当前大部分光模块[9][10][11] * 性能:光信号几乎无损耗,相比电信号损耗具有明显优势[11] * 未来成本展望:新兴**NPO、CPO**等技术初期价格预计在**0.3-0.4美元/Gbps**,并有望进一步下降,长期看可能实现与铜连接相当甚至更低的成本[3][11][12] * **厂商技术路径与带宽弹性差异**:不同厂商在SKA光互联实现上存在差异,反映在带宽比上:**英伟达SKU与OUT速率比约为9倍**,**华为Cloud Matrix为7倍**,**阿里为8倍**,这体现了各家在UP和OUT层数结构上的不同[3][9] * **市场规模与行业逻辑**: * **Scale Up**被认为是巨大的蓝海市场,其市场规模显然大于**Scale Out**,早期可能存在数倍差距[15] * 光模块行业具有显著的**通胀逻辑**,**Sparse光连接**是当前最大的通胀逻辑,为市场提供了新的增量空间[16] * **产业链价值分配**: * 目前整套解决方案(包括NPO)100%直接销售给云服务提供商[12] * **CPU**在生态系统中的主导权与价值量存在分歧,其最终价值取决于参与度(市场份额系数)[3][13] * 转向**光引擎**形态(如NPU、CPU、LPU)预计能带来比现有光模块更高的净利润,以补偿标准化ASP下降的影响[13][14] * **投资预期与估值**: * 行业变化(如柜内进光、超节点项目)是逐步兑现的过程,预计从2026年年中之后开始,并持续至2027-2029年[16] * 因此,投资应关注**PE(市盈率)的增加**,而非短期EPS上修[16] * 当前行业约**20倍**的PE被严重低估,考虑到超级通胀逻辑,未来应给予**30倍以上甚至40倍**的PE[17] 其他重要内容 * **Dragonfly互联技术**的作用在于优化网络层数,避免增加延时,其设计核心是满足客户对高效传输的需求[7] * 在超节点架构中,不同厂商增加光模块配比的方式不同:谷歌使用OCS技术,交换机侧无需大量光模块;华为和阿里则通过电交换机和NPU增加更多光模块端口[9]