文章核心观点 - 生成式AI的快速发展对算力和网络基础设施提出新要求,推动IP广域网从“连接赋能”向“算力赋能”再向“AI赋能”演进 [1] - 在国家政策与产业需求驱动下,智能IP广域网(AI WAN)应运而生,旨在构建AI内生的高智能、高可靠、高安全网络,服务于AI大模型训练推理等新型应用 [2] - 广域网发展呈现从“智算互联”到“智能体互联”的趋势,前者要求网络具备无损、超高吞吐、超低时延特性,后者将引发网络发展范式的根本性变革 [3][4] - AI WAN将促进广域网络在基础协议和应用协议两个层面进行全栈创新,以支撑新型智算业务和海量智能体互联 [5][6] - 中国移动在多项关键网络技术上取得领先,包括抗损高吞吐传输、算力路由、G-SRv6、空芯光纤等,并积极布局智能体互联网的标准与架构 [6][7][8][9][10][11] 政策与产业背景 - 2023年,中国发布《算力基础设施高质量发展行动计划》等政策,强调算力高质量发展和算网融合基础设施建设的重要性 [1] - 2025年,国务院《关于深入实施“人工智能+”行动的意见》进一步强调强化智能算力统筹,完善全国一体化算力网,发挥“东数西算”国家枢纽作用 [1] - 国家政策和产业需求双轮驱动,需要构建AI内生的高智能、高可靠、高安全的IP广域网络 [2] 智算广域互联的网络需求 - 无损网络连接:网络中2%的丢包率将导致吞吐量降至0,50ms保护倒换会引起算效下降或断点重训,原生RDMA丢包重传机制会引发明显算力损伤 [3] - 超高吞吐传输机制:智算数据广域传输规模达PB级,网络带宽增速与CPU性能增速比率超过10,现有广域传输协议(如TCP)拥塞控制机制无法匹配带宽增长 [3] - 超低时延转发:网络时延对不同并行训练方式效率影响巨大,例如TP(张量并行)需要服务器内超低时延,PP(流水线并行)、DP(数据并行)等需要跨服务器的可并行时延分配 [3] 智能体互联网引发的范式变革 - 新互联主体:互联主体从以人类为核心,向人类与智能体协作共生的“人智协同”模式演进,网络中大量存在用户、智能体、工具之间的互联 [4] - 新交互范式:催生多模态用户界面“MUI”,融合语音、图像、视觉等多种感知模态,实现更自然、高效、个性化的人机交互 [5] - 新协作模式:人类定位从“操作主体”向“决策主体”转变,智能体承担任务执行逻辑的核心制定职责 [5] - 新资源抽象:“工具”被提升到核心地位,实现对数据、算力等资源要素的高度抽象和动态使用,重塑传统以数据和算力为核心的资源格局 [5] - 智能体互联网将自主产生多样化的上下行对等异构流量,当前网络中下行视频流量约占70% [11] AI WAN基础协议创新(中国移动案例) - 传输层:广域抗损高吞吐技术 - TCP单流吞吐随时延和丢包率增加急剧下降,多流吞吐存在性能拐点,不会随流数线性增加 [6] - 中国移动首创4项“抗损”创新机制,构建半卸载uQUIC、全卸载uRDMA两类技术方案 [6] - 已完成天文观测、影视素材搜集等10多个省市的现网应用 [6] - 网络层:算力路由技术 - 分布式AI推理业务需要低时延调度,边缘计算节点使网络时延和计算时延处于同一量级(5ms左右) [7] - 中国移动提出算力路由技术,实现算网一体化路由与调度 [7] - 已取得IETF国际标准突破,发布全球首台算力路由器,建设5省20地市中试网络 [7] - 网络层:G-SRv6(压缩SRv6技术) - 原生SRv6承载效率低,对于平均长度256byte的净荷,带宽利用率仅为60% [8] - 中国移动原创提出G-SRv6头压缩技术,可将报文开销压缩到1/4以下 [8] - 2025年牵头发布RFC9800(我国主导的首个整百号互联网基础标准),已建成全球规模最大、技术领先的G-SRv6策略路由网络 [8][9] - 物理层:空芯光纤技术 - 空芯光纤以空气导光,可降低30%传输时延并提升数十倍单纤容量 [10] - 中国移动创造单波1T 10714km传输距离世界纪录,较实芯光纤提升10余倍 [10] 智能体互联网应用协议创新 - 标识解析:为智能体提供身份、能力、所属关系等统一标识,可采用分布式标识DID技术,解析机制可参考IP广域网DNS或新建专属域名解析 [13] - 认证授权:聚焦双向身份可信、动态权限适配、全链路风险管控三大核心需求,可采用X.509、DID+X.509混合模式,扩展OAuth协议,并选用RATS或AI异常检测进行风险管控 [14] - 转发路由:为异构、跨域智能体提供可访问、开放式、安全的互联机制,可部署智能体边界网关,采用基于能力的寻址方式,支持Anycast路由模型,并可配合算力路由机制 [15] - 网络运维:智能体可集成在网络管控面,将用户自然语言意图转化为网络可执行动作,大幅提升网络管理效率与可靠性,实现从意图解析到状态反馈的全流程支撑 [16] 未来发展方向与行业展望 - 广域网需从三方面深化发展:AI内生驱动,构建高性能智算网络;持续提升性能,向吞吐、丢包率等多维定制化指标演进;新型业务融合,为AI训推、智能体互联提供灵活、动态、智能的多元服务 [17] - 需发挥中国在算力网络基础设施建设和原创技术标准方面的优势,持续构建自主的AI WAN技术 [18] - 智能体之间自主执行的特征将极大解放人类生产力,重构数字经济运作模式,深刻改变社会生产生活方式 [5]
AI WAN:从智算互联到智能体互联,开启IP广域网创新之路