Workflow
阿里云超节点
icon
搜索文档
阿里云栖大会第一日——超节点
小熊跑的快· 2025-09-24 04:38
阿里云超节点架构 - 大模型训练推理对显存容量和带宽需求增长 传统GPU单机8卡方案无法满足业务需求[4] - 超节点解决方案采用多卡组成 具备大容量显存和低延迟共享特性[4] - 超节点设计基于高密度集成的PPU芯片 充分发挥芯片设计优越性[6] UALink互联协议 - 超节点采用UALink协议 联盟成员包括AMD AWS Google Intel Meta Microsoft等[5] - AMD贡献Infinity Fabric协议促成联盟成立 阿里云加入该联盟[5] - 协议针对行业自有技术演进成本高问题 提供开放互联方案[5] 硬件性能参数 - PPU配备96GB HBM2e显存 高于A800的80GB 与H20容量一致[10] - 片间互联带宽达700GB/s 远超A800的400GB/s 略低于H20[10] - 支持PCIe 5.0×15接口 优于A800的PCIe 4.0×16 与H20同代[10] - 功耗400W与A800相同 低于H20的550W[10] - 基础版峰值算力120TFLOPS专注AI推理 高级版支持AI训练[10] 网络与拓扑架构 - ALS-D系统在UALink上补充在网计算加速特性 支持Switch组网模式[9] - 采用基于Switch硬件连接方案 支持单层和二层互连拓扑[9] - 可扩展至数百/数千节点互连 满足并行计算发展需求[9] 系统集成方案 - 超节点实现单机64卡配置 磐久机柜功率达300千瓦[9] - 采用铜线链接方案提升密度 对互联协议有特定要求[9] - 通过MoE技术提升模型表达能力 降低算力需求[8]