中信证券:看好超节点服务器整机环节 建议关注产业链相关公司
智通财经网·2025-12-19 00:55

核心观点 - 超节点服务器作为适配MoE架构模型的底层AI基础设施基本计算单元,有望快速上量,并通过更高的技术附加值和系统整合角色提升整机环节的价值量 [1][5][7] 技术背景与需求 - MoE(混合专家)架构成为主流AI大模型追求更大参数与更高效率的选择,其专家并行计算模式在优化计算与访存瓶颈的同时引入了新的通信难题,催生了基于Scale up网络的超节点解决方案 [2] - 相较于传统八卡服务器,超节点面临海量芯片协同带来的系统散热压力、光铜混合互连的稳定性问题以及多零部件长期运行的可靠性隐患等系统性挑战 [2] 市场格局与发展阶段 - 海外超节点解决方案以英伟达NVL72和Google采用自研TPUv7芯片的Ironwood Rack(最大支持9216颗芯片集群)为代表 [3] - 国内近期涌现出华为CloudMatrix384、阿里磐久、曙光ScaleX640等超节点解决方案 [3] - 当前是超节点解决方案的早期发展阶段,技术方案呈现“百家争鸣”状态,未来预计将逐步收敛到有限方向 [3] 关键技术趋势 - 算力密度:更大规模的Scale up域有望带来模型训练及推理的性能收益,但具体规模需结合成本与可靠性等因素,依赖技术发展确定 [3] - 网络拓扑:胖树结构在通用性上或短期占据更高市场份额,而具备软硬件自研能力的大厂有望尝试3D-Torus等方案 [3] - 物理连接:无背板正交方案在连接简洁性、机柜紧凑性方面具备优势,或将成为未来主流技术方案 [3] - 散热方案:随着单机柜算力密度提升,PUE更接近1的液冷方案(如相变浸没液冷)若解决稳定性问题,将迎来更大发展机会 [4] 产业链价值重塑 - 传统八卡AI服务器产业链分工清晰,服务器厂商主要承担标准化零部件组装,技术门槛相对集中于单一部件 [5] - 超节点服务器的技术复杂度实现质的跃升,涉及多芯片功耗管控、高密度集成散热、整机柜级长期可靠性等系统性挑战 [5] - 服务器厂商角色从“组装者”转变为“系统整合者”,需从设计之初深度考量芯片、散热、互连等多部件耦合关系,通过跨环节技术协同解决问题 [5] - 这种系统化、一体化的设计与整合需求大幅提升了技术门槛,强化了整机环节在产业链中的话语权,使其成为把握技术方向与系统性能的核心枢纽,技术附加值有望显现 [1][5] 发展前景与投资关注 - 超节点技术方兴未艾,MoE架构料将成为大模型主流架构,其特殊性对硬件提出新要求 [7] - 超节点有望通过高效的网络通信及原生内存语义提供更优解决方案,并成为未来AI基础设施的底层计算单元 [1][7] - 算力密度提升、散热能力提升、稳定性和可靠性提升具备高确定性,相关技术为服务器整机制造带来新要求 [7] - 具备定制化开发能力及供应链管理能力的服务器厂商有望获得更大发展机会 [7]