Workflow
Passage M1000
icon
搜索文档
光物质通道:AI 用 3D 光子互连板 --- Lightmatter Passage _ A 3D Photonic Interposer for AI
2025-09-22 00:59
Lightmatter Passage : A 3D Photonic Interposer for AI 光子通道:AI 用 3D 光子互连板 Over the past decade, the scale of AI models and their computational demands have grown exponentially—from early models with only a few million parameters to today's models with hundreds of billions or even trillions. For instance, training large language models such as GPT-3 and GPT-4 typically requires thousands of GPUs in scale-out distributed systems to complete within a reasonable time. However, this expansion approach faces signi ...
英伟达详解CPO,光芯片闪耀Hotchips
半导体行业观察· 2025-08-27 01:33
英伟达Spectrum-X以太网光子技术 - 公司提出共封装光子学需求以提升AI工厂规模 AI工厂光功率消耗是传统云数据中心17倍 主要因GPU集群增加需要数十光收发器通信[3] - 网络光子学成本占AI工厂总计算能力10% 公司通过Spectrum-X以太网光子技术降低此成本[3] - Spectrum-X采用200G/通道SerDes技术 相比可插拔收发器具有更好信号完整性和更低DSP要求 因光子引擎紧邻交换机ASIC[16] - 1.6Tb/s链路激光器数量从8个减至2个 实现更低功耗和更高传输可靠性[16] - 技术为AI工作负载提供低抖动通信 避免GPU空闲导致高昂成本[17] - 技术提供更高NCCL性能 确保大型基础设施多作业执行不相互干扰[20] - 硅光子解决方案采用硅光子CPO芯片 传输速率达1.6T 集成MRM提供更高带宽同时降低功耗和占用空间[29] - 光子层和电子层采用3D堆叠技术 降低布线复杂性并提高带宽密度[29] - 数据中心采用该技术后能效提高3.5倍 弹性提高10倍 运行时间提高1.3倍[29] - 公司展示首款集成光子技术全尺寸交换机Spectrum-6 102T[30] - 技术实现2倍吞吐量 63倍信号完整性 激光器数量减少4倍 1.6倍带宽密度 激光可靠性提高13倍 取代64个独立收发器[34] - 下一代技术无需耗电连接可插拔光学引擎 节省大量电力[37] - 跨规模网络起始距离约500米 超过后需调整算法适应距离变化[74] - 共封装硅光学器件支持在ISO功率下将GPU性能提高3倍 激光器总数减少约4倍[74] Celestial AI光子结构技术 - 公司光子结构链路技术利用光连接下一代海量GPU和加速器芯片 取代当前电连接[75] - 技术聚焦下方带中介层HBM PFLink拥有包含无源和有源元件硅光子层[80] - 公司将SerDes与通道匹配以实现极高能效 并构建光学MAC实现RAS功能[80] - 使用EAM调制技术 从热学角度看优于环形调制器[81] - 技术可释放前沿阵地 光I/O可发生在ASIC中心 芯片其余部分用于电气I/O如HBM[92] - 在光子结构模块Gen1中用于带交换机连接内存16端口交换机[97] - 公司已完成四次流片[101] Ayar Labs光学I/O技术 - 公司展示UCIe光纤I/O重定时器 制作UCIe芯片组轻松集成光纤I/O到封装 因基于标准[108] - 芯片组是8Tbps级设备 提供大量封装外带宽[108] - 光学I/O芯片帮助使用光学技术进行横向扩展[117] - UCIe是基于标准方式 企业可根据通用规范构建软件包便于集成[122] - 数据重新定时后进入光端 解耦光信号和电信号传输挑战[130] - Chiplet速度达8Tbps[137] - 测试显示230mV眼图 约5天测试所有16 UCIe模块无错误 累积比特达1.8019e+18 BER为0.0000e+00[142] - 一体封装500W设备 热循环测试重要因芯片加热冷却导致材料膨胀收缩改变光传播方式[150] - 端到端测试10小时链路测试结果 公司从EVT进入DVT阶段即将量产[156][159] Lightmatter Passage技术 - 公司推出Passage M1000 将共封装光学器件和硅光子技术带入Chiplet时代[170] - 新解决方案承诺最高达114Tbps带宽 即每个方向57Tbps[184] - 采用3D堆叠芯片 光发射器/接收器需紧凑 GPU芯片连接SerDes SerDes连接光端[188] - 使用硅微环调节光 实现非常紧凑光学I/O[191][193] - 微环直径约15um 功耗约1mW 传输损耗<10dB 兼容O-band和C-band[196] - 公司有16种波长激光称为Lightmatter指南[196] - 设备具光路交换功能实现冗余[211] - M1000是迈向超过200Tbps XPU和超过400Tbps带宽交换机第一步[224] - 公司表示已做好生产准备 将在SC25大会公开演示[226][231] 行业动态与创新 - 曦智科技联合燧原科技推出国内首款xPU-CPO光电共封芯片[233] - OpenLight Photonics完成3400万美元A轮融资 加速硅光子学过渡[234] - 硅光子学解决AI连接瓶颈 因网络限制大多数AI开发者仅利用约25% GPU容量[234] - 公司设计构建光子专用集成电路(PASIC) 为光互连提供动力[235] - PASIC帮助使现有基于光子学互连速度更快 传统硅光子学性能上限约每波导200Gbps[236] - 公司提供设计服务和工艺设计套件(PDK) 基于磷化铟和硅光子学异构集成[236] - 客户可定制PASIC 首批客户2025年底开始生产 2026年带来首笔专利费收入[237] - 计划扩展PDK库 提供速率达400Gbps调制器和更先进片上激光技术[238] - 光互连快速采用不可避免 因AI模型数据需求增加和降低基础设施成本愿望[239]
初创公司,创新光互连
半导体行业观察· 2025-04-27 01:26
数据中心光互连技术趋势 - 人工智能数据中心面临铜互连在空间和带宽上的限制,行业正转向更大尺寸、更多处理器的芯片,推动更密集、更长距离的光纤连接替代铜线[2][5] - 共封装光学器件(CPO)成为提升能源效率的关键技术,英伟达已量产集成光子调制器的网络交换机,将光子技术引入机架内部[2][5] - 初创公司挑战传统观点,将光学互连直接连接至GPU和内存封装,解决一米链路内铜缆带宽不足的问题[5][6] 初创公司光互连创新 - Ayar Labs推出业界首个GPU间光学互连方案,采用UCIe接口和波分复用技术,实现256通道、8 Tbps总带宽,支持2公里通信距离[4][8] - LightMatter的Passage系列产品通过3D堆叠技术集成光学电路,L200为模块化设计,M1000则实现完全集成的光学中介层,直接连接GPU与内存[8] - Xscape Photonics集成频率梳激光器至芯片,解决"逃逸带宽"问题,其ChromX平台获4400万美元融资加速量产[8] 技术路径与竞争 - 微环谐振器和多波长激光器成为主流方案,但面临成本与灵活性挑战,例如512个GPU集群需超3万个连接,多波长可能降低粒度[10] - Avicena采用MicroLED成像光纤技术,以300个MicroLED实现3 Tbps传输,无激光器设计降低5倍能耗,被看好为未来技术方向[11] - 行业分歧明显:LightCounting预测CPO将先限于交换机,GPU集成或需至2030年,而Sindhu强调解决GPU互连是"时代最重要的封装难题"[11] 商业化进展 - 曦智科技推出全球首款片上光网络处理器Hummingbird,通过光子-电子垂直堆叠封装实现全对全数据广播网络,显著降低延迟与功耗[5] - 英伟达CPO交换机量产引发行业震动,但初创公司正推动光学技术更靠近数据源,从芯片封装层面直接传输带宽[2][5]
AI芯片带宽,终于有救了
半导体芯闻· 2025-04-02 10:50
Lightmatter光子互连产品发布 - 公司推出两款硅光子互连产品Passage M1000光学中介层和L200系列 旨在满足AI部署对芯片间带宽增长的需求[1] - Passage M1000预计2024年夏末出货 支持XPU或多芯片开关 采用光直接传输数据技术 总带宽达14.25TB/s[1][2] - L200和L200X计划2026年推出 分别提供32Tb/s和64Tb/s双向带宽 采用3D封装技术 支持超200Tb/s封装外通信[3] 产品技术特点 - M1000采用中介层设计 位于计算逻辑和基板之间 支持多芯片堆叠 通过256个光纤连接点实现芯片间全表面区域数据传输[2] - 产品采用56Gb/s NRZ调制和波分复用技术 每光纤支持8个波长 实现56GB/s带宽[2] - L200系列采用Alphawave Semi技术 包括UCIe互连标准和光学就绪SerDes 支持多供应商芯片互通[3] 行业竞争格局 - 光子学领域竞争激烈 Nvidia、英特尔、博通和Ayar Labs等公司均在开发相关技术[1] - Lightmatter产品带宽显著高于Ayar Labs的8Tb/s光子芯片[3] - 新兴UCIe互连标准有望成为行业通用语言 类似PCIe或CXL[3]