共封装光学器件(CPO)

搜索文档
英伟达详解CPO,光芯片闪耀Hotchips
半导体行业观察· 2025-08-27 01:33
英伟达Spectrum-X以太网光子技术 - 公司提出共封装光子学需求以提升AI工厂规模 AI工厂光功率消耗是传统云数据中心17倍 主要因GPU集群增加需要数十光收发器通信[3] - 网络光子学成本占AI工厂总计算能力10% 公司通过Spectrum-X以太网光子技术降低此成本[3] - Spectrum-X采用200G/通道SerDes技术 相比可插拔收发器具有更好信号完整性和更低DSP要求 因光子引擎紧邻交换机ASIC[16] - 1.6Tb/s链路激光器数量从8个减至2个 实现更低功耗和更高传输可靠性[16] - 技术为AI工作负载提供低抖动通信 避免GPU空闲导致高昂成本[17] - 技术提供更高NCCL性能 确保大型基础设施多作业执行不相互干扰[20] - 硅光子解决方案采用硅光子CPO芯片 传输速率达1.6T 集成MRM提供更高带宽同时降低功耗和占用空间[29] - 光子层和电子层采用3D堆叠技术 降低布线复杂性并提高带宽密度[29] - 数据中心采用该技术后能效提高3.5倍 弹性提高10倍 运行时间提高1.3倍[29] - 公司展示首款集成光子技术全尺寸交换机Spectrum-6 102T[30] - 技术实现2倍吞吐量 63倍信号完整性 激光器数量减少4倍 1.6倍带宽密度 激光可靠性提高13倍 取代64个独立收发器[34] - 下一代技术无需耗电连接可插拔光学引擎 节省大量电力[37] - 跨规模网络起始距离约500米 超过后需调整算法适应距离变化[74] - 共封装硅光学器件支持在ISO功率下将GPU性能提高3倍 激光器总数减少约4倍[74] Celestial AI光子结构技术 - 公司光子结构链路技术利用光连接下一代海量GPU和加速器芯片 取代当前电连接[75] - 技术聚焦下方带中介层HBM PFLink拥有包含无源和有源元件硅光子层[80] - 公司将SerDes与通道匹配以实现极高能效 并构建光学MAC实现RAS功能[80] - 使用EAM调制技术 从热学角度看优于环形调制器[81] - 技术可释放前沿阵地 光I/O可发生在ASIC中心 芯片其余部分用于电气I/O如HBM[92] - 在光子结构模块Gen1中用于带交换机连接内存16端口交换机[97] - 公司已完成四次流片[101] Ayar Labs光学I/O技术 - 公司展示UCIe光纤I/O重定时器 制作UCIe芯片组轻松集成光纤I/O到封装 因基于标准[108] - 芯片组是8Tbps级设备 提供大量封装外带宽[108] - 光学I/O芯片帮助使用光学技术进行横向扩展[117] - UCIe是基于标准方式 企业可根据通用规范构建软件包便于集成[122] - 数据重新定时后进入光端 解耦光信号和电信号传输挑战[130] - Chiplet速度达8Tbps[137] - 测试显示230mV眼图 约5天测试所有16 UCIe模块无错误 累积比特达1.8019e+18 BER为0.0000e+00[142] - 一体封装500W设备 热循环测试重要因芯片加热冷却导致材料膨胀收缩改变光传播方式[150] - 端到端测试10小时链路测试结果 公司从EVT进入DVT阶段即将量产[156][159] Lightmatter Passage技术 - 公司推出Passage M1000 将共封装光学器件和硅光子技术带入Chiplet时代[170] - 新解决方案承诺最高达114Tbps带宽 即每个方向57Tbps[184] - 采用3D堆叠芯片 光发射器/接收器需紧凑 GPU芯片连接SerDes SerDes连接光端[188] - 使用硅微环调节光 实现非常紧凑光学I/O[191][193] - 微环直径约15um 功耗约1mW 传输损耗<10dB 兼容O-band和C-band[196] - 公司有16种波长激光称为Lightmatter指南[196] - 设备具光路交换功能实现冗余[211] - M1000是迈向超过200Tbps XPU和超过400Tbps带宽交换机第一步[224] - 公司表示已做好生产准备 将在SC25大会公开演示[226][231] 行业动态与创新 - 曦智科技联合燧原科技推出国内首款xPU-CPO光电共封芯片[233] - OpenLight Photonics完成3400万美元A轮融资 加速硅光子学过渡[234] - 硅光子学解决AI连接瓶颈 因网络限制大多数AI开发者仅利用约25% GPU容量[234] - 公司设计构建光子专用集成电路(PASIC) 为光互连提供动力[235] - PASIC帮助使现有基于光子学互连速度更快 传统硅光子学性能上限约每波导200Gbps[236] - 公司提供设计服务和工艺设计套件(PDK) 基于磷化铟和硅光子学异构集成[236] - 客户可定制PASIC 首批客户2025年底开始生产 2026年带来首笔专利费收入[237] - 计划扩展PDK库 提供速率达400Gbps调制器和更先进片上激光技术[238] - 光互连快速采用不可避免 因AI模型数据需求增加和降低基础设施成本愿望[239]
英伟达CPO,路线图披露
半导体行业观察· 2025-08-25 01:46
行业技术趋势 - AI GPU集群通信需求增长推动光通信技术应用 转向硅光子互连与共封装光学器件(CPO)实现更高传输速率和更低功耗[2] - 铜缆在800Gb/s速度下不实用 服务器到交换机及交换机间链路需光纤连接 因距离延长使铜缆不切实际[4] - 可插拔光模块存在局限性 信号离开ASIC后转换产生严重电损耗 200Gb/s通道损耗达22分贝 每端口功耗增至30W[6] - CPO技术将光转换引擎与交换机ASIC并排嵌入 电气损耗降至4分贝 每端口功耗降至9W 减少故障组件并简化光互连实施[8] - CPO相比可插拔模块功率效率提高3.5倍 信号完整性提高64倍 弹性提高10倍 部署速度提高约30%[8] 公司产品规划 - NVIDIA下一代Quantum-X和Spectrum-X光子互连解决方案2026年上市[2] - Quantum-X InfiniBand交换机2026年初推出 提供115Tb/s吞吐量 支持144个800Gb/s端口 集成ASIC具14.4TFLOPS网络处理能力 采用液冷散热[9] - Spectrum-X Photonics平台2026年下半年推出 基于Spectrum-6 ASIC SN6810提供102.4Tb/s带宽和128个800Gb/s端口 SN6800可扩展至409.6Tb/s带宽和512个800Gb/s端口 采用液冷技术[11] - CPO交换机支持生成式AI应用 减少数千分立组件 提升安装速度、维护便捷性和连接功耗 改善启动时间、首次令牌时间及可靠性[13] - 共封装光学器件成为未来AI数据中心结构性要求 定位为超越竞争对手的关键优势[13] 技术合作与发展 - NVIDIA路线图与台积电COUPE平台紧密相关 分三个阶段发展[2][15] - 台积电第一代COUPE采用SoIC-X封装技术 堆叠65纳米EIC与PIC 具低阻抗和高能效 用于OSFP连接器 数据传输速率达1.6Tb/s[15][18] - 第二代COUPE集成到CoWoS封装 光学器件与交换机共封装 实现6.4Tb/s主板级光互连[2][18] - 第三代COUPE目标集成到处理器封装 传输速率达12.8Tb/s 进一步降低功耗和延迟[2][18]
英伟达CPO,掀起新大战
半导体行业观察· 2025-03-26 01:09
共封装光学技术(CPO)概述 - 共封装光学器件(CPO)通过将光/电转换靠近交换芯片,显著提高带宽并降低功耗,简化了组件结构并减少电子信号传输距离 [2] - 该技术采用先进封装,用硅光收发器芯片包围网络芯片,光纤直接连接封装,仅激光器保持外部,每八个数据链路仅需一个激光器 [2] - 行业专家认为CPO是"酝酿已久"的技术,但此前因缺乏标准化和工程复杂性未获广泛采用 [3][4] 技术优势与行业需求 - 传统可插拔光收发器功耗达20W-40W/模块,在40万GPU的数据中心中消耗总GPU功耗的10%(40兆瓦),其中24兆瓦仅用于激光器供电 [4] - Nvidia的1.6T CPO端口功耗仅9W,较传统30W可插拔方案降低70%,功率效率提升3.5倍 [5][17] - CPO可减少63倍信号传输延迟,提高10倍网络抗中断能力,并加速30%数据中心部署速度 [18] 封装技术路径 - **2D集成**:PIC与EIC并置PCB,成本低但寄生电感高,限制带宽 [6] - **2.5D集成**:通过TSV中介层连接,提升I/O密度但成本增加,寄生效应仍存 [7] - **3D集成**:采用TSV/混合键合堆叠EIC与PIC,显著降低寄生效应但散热挑战大 [9][10] - **3D单片集成**:光子与电子元件同芯片集成,简化封装但受限于旧工艺节点 [11] Nvidia的CPO解决方案 - 基于微环调制器(MRM)技术,台积电COUPE工艺制造,单封装集成18个硅光子引擎,实现324光连接/288数据链路,总吞吐4.8Tb/s [16] - 合作伙伴包括台积电、Lumentum等11家企业,采用液冷设计,2024下半年推出Quantum-X交换机,2026年推出Spectrum-X [17][18] - Quantum-X提供144个800Gb/s端口,Spectrum-X支持128/512端口,总带宽达100Tb/s/400Tb/s [18][19] 竞品对比与行业动态 - Broadcom采用Mach-Zender调制器推出51.2T CPO交换机,功耗降低50%,但技术路线较保守 [22][23] - Nvidia的MRM方案更紧凑但对温度敏感,Broadcom的MZM更成熟但体积大、光损耗高 [24] - 初创公司如Ayar Labs正探索将光学互连集成至GPU封装,Lightmatter研发3D堆叠光子基板 [28] 未来发展趋势 - CPO将成为百万级GPU数据中心的必备技术,Nvidia计划2028年实现NVLink光学互连 [29] - 现有硅调制器可能限制在400Gb/s以下,铌酸锂等新材料有望突破速率瓶颈 [26] - 行业需解决异构集成成本、热管理及标准化问题,可插拔光学器件仍将持续迭代 [26][29]