联想万全异构智算研发团队论文被IEEE CyberSciTech 2025收录
技术突破与核心创新 - 论文提出RNL技术,通过多维感知、路径负载均衡优化与增量流量迁移,解决AI训练与推理场景中RoCE网络负载均衡的长期难题 [1] - 技术构建“多维感知+路径负载均衡+增量迁移”闭环体系,多维感知机制可实时感知网络拓扑结构、AI任务网络需求及RoCE链路负载状态 [1] - 路径负载均衡优化通过虚拟-物理网络映射与路径评分算法智能选择最优数据传输路径,增量流量迁移策略在调整链路流量时避免瞬时延迟 [1] - 与传统方案不同,RNL基于通用RoCE交换机实现AI网络优化,无需绑定专用硬件,核心创新在于融合AI业务通信带宽与时延评估算法,结合多维链路拥塞评估机制 [2] 性能表现与成本优势 - 在实测环境中,RNL技术展现出高可靠性,集合通信原语性能提升50%,带宽利用率达85%,负载均衡离散度降低90% [2] - AI推理场景下,TPS(每秒处理事务数)提升26%,TTFT(首字节时间)时长减少30%,TPOT(每输出令牌时间)时长减少22% [2] - 整体部署成本降低60%,为AI集群的规模化落地提供了经济高效的网络基础 [2] 商业应用与战略影响 - RNL技术已纳入联想万全异构智算平台的落地规划,将巩固该平台在AI异构计算市场的技术壁垒 [4] - 该技术有助于提升公司在AI异构计算行业的行业影响力与核心竞争力 [4]