显卡还没跑满,数据中心先被“网线”卡脖子了
36氪·2025-12-17 01:23

文章核心观点 - 微软正在研究名为MOSAIC的Micro LED光互联技术,旨在解决AI算力中心因数据传输瓶颈而被“卡脖子”的问题,该技术有望在功耗、传输距离和带宽之间提供更优的平衡方案,可能成为AI竞赛下半场的关键[1][12][25] 数据中心现有连接方案的瓶颈 - 民用网线速率上限约为10 Gbps,而AI算力中心的交换机端口速率需400 Gbps起步,需求存在巨大差距[4] - 铜缆为达到高速率,有效传输距离通常仅1-2米,限制了其在机柜间的应用[8] - 光纤虽传输距离远,但光电转换电路功耗高、对温度敏感且易老化,在高温机房环境下故障率高;微软论文指出,若全用光纤互联,英伟达GB200 NVL72机柜功耗将暴涨17%,超大规模GPU集群每6-12小时会发生一次链路故障[9] - 英伟达GB200 NVL72因铜缆距离限制,被迫将72个GPU集成于单个机架,导致供电和散热压力巨大,且维护困难[11][12] Micro LED光互联技术(MOSAIC)的原理与优势 - 技术原理:利用Micro LED像素阵列作为光源,每个独立发光的像素即一条光通道,通过控制像素亮灭(1/0)来传输数据[14][16] - 传输模式:采用“宽而慢”架构,每个Micro LED通道速率仅2 Gb/s,但通过集成400个像素点阵列,即可实现800 Gbps的总带宽[16][17] - 体积与集成度:Micro LED像素尺寸仅几微米至几十微米,400像素点阵列的核心芯片体积不足1 mm³,远小于传统800Gbps光模块(核心光源/调制器体积达十几至几十mm³)[19] - 线缆方案:采用多芯成像光纤,单根线缆内部包含成千上万个纤芯,可承载数百个光通道,实现高带宽连接;传输距离可达50米,远超铜缆极限[21][22] - 功耗与可靠性:相比传统光纤互联,MOSAIC功耗最多可降低68%,故障率可降至原来的1/100[23] 技术发展现状与产业影响 - 当前状态:Micro LED光通信仍处于技术验证阶段,台积电、Avicena、兆驰等厂商正在进行原型机开发和产业布局,尚未大规模商用[25] - 潜在影响:该技术通过降低功耗和提升通信效率,有望缓解国外电力紧缺问题,并解决算力中心通信效率的瓶颈[25] - 行业展望:通信效率的革命可能弥补算力单元的劣势,例如华为通过384颗NPU互联对标英伟达GB200;新的光通信协议可能成为AI竞赛下半场实现“弯道超车”的关键[25]