Workflow
光跃LightSphere X分布式全光互连芯片及超节点解决方案
icon
搜索文档
21专访|曦智科技沈亦晨:两年前预见的超节点未来,正在兑现
21世纪经济报道· 2025-08-12 06:17
行业背景与趋势 - 大模型参数规模迈向万亿 算力集群进入千卡和万卡协同时代 行业共识是以集群性能取代单一芯片性能比拼[1] - 超节点概念在2024年形成 指超过8卡连接的节点 此前2023年尚无此概念[4] - 光互连技术成为国内超节点发展的必然趋势 因国产GPU需跨机柜连接才能对标NVL 72算力 而电互连受物理限制仅支持机柜内连接[16] - 光电融合技术发展周期长达20年 将从NPO/OBO进阶到CPO再到3D CPO 互连带宽有1-2个数量级提升空间[17] - 主流厂商包括英伟达 博通 AMD 英特尔均在布局光互连技术 因单芯片带宽需求增大 电互连已近极限[16] 公司技术方案与创新 - 发布光跃LightSphere X分布式全光互连芯片及超节点解决方案 创新引入光互连技术打破物理机柜限制 实现跨机柜Scale-Up网络[1] - 提供两种超节点方案:光互连电交换(成熟方案)和光互连光交换(创新方案)[5] - 光互连光交换方案全球首创 用光替代电进行交换和互连 具有三大优势:延迟更低 成本更低(省一半光芯片) 协议无感[7] - 采用开放PCIe协议 可适配多家国产GPU 而英伟达和华为使用私有协议NVLink和UB[6] - 光互连方案部署复杂度低于电互连 兼容现有数据中心 通过光缆快速组网 无需定制机房[14] - 联合推出国内首款xPU-CPO光电共封装原型系统 采用短距离SerDes技术增加带宽密度 实现光芯片与计算芯片共封装[18] 性能与成本优势 - 基于分布式光交换的超节点规模无上限 可支持万卡集群[9] - 理论数据显示单位成本仅为NVL72的31% GPU冗余率低一个数量级 模型算力利用率较NVIDIA DGX最高提升3.37倍[12] - 光互连方案总成本不必然高于电互连 且散热更易 因功耗分散至多个机柜[14] - 光互连电交换方案支持8台服务器共64张xPU卡高速互连 提供灵活高效的并行策略[6] 商业进展与规划 - 与沐曦合作光互连电交换方案 与阶跃星辰合作万亿参数大模型训练基础设施建设[12] - 几千卡算力集群正在上海落地 目标年内落地万卡集群[11] - 与国内头部芯片厂商建立深度合作 包括传统GPU厂商和非传统架构厂商[12] - CPO技术尚未广泛接受 但国内产业链成熟 全面落地指日可待[13] - 公司团队近250人 研发人员占比超80% 核心成员来自MIT和半导体行业[24] 战略定位与竞争优势 - 战略聚焦光互连及光芯片核心技术产品创新 占据有利生态位[2] - 选择开放生态道路 降低技术使用门槛 与英伟达和华为的封闭生态形成差异[23] - 核心竞争力来自底层核心技术自主研发(如光交换芯片)和系统级工程迭代能力[23] - 具备光电协同设计和先进封装能力 国内同时具备此全面能力的企业屈指可数[23] - 技术积累来自光计算领域 已实现3D CPO 因此在光互连领域具备降维打击优势[20]