Workflow
超节点架构
icon
搜索文档
超节点架构创新,开源开放共筑全场景算力底座
中国能源报· 2025-09-18 09:10
超节点架构创新 - 公司推出创新的超节点架构 可将多台物理机器深度互联 实现逻辑层面像一台机器一样学习与推理 重新定义高效稳定可扩展的大规模有效算力新范式[1] - 超节点架构基于灵衢互联协议 具备资源池化、规模扩展、长稳可靠的关键特性 通过统一协议和内存编址使有效算力随集群规模线性扩展[2] - 该架构已通过Atlas 900 A3 SuperPoD实现商业化部署 累计部署300多套 服务于互联网、金融、运营商等20多个行业客户[2] 新产品发布 - 推出全液冷数据中心AI超节点Atlas 950 SuperPoD 采用正交架构实现零线缆电互联 液冷接头浮动盲插设计做到零漏液 光模块液冷可靠性提升一倍[4] - Atlas 950支持UB-Mesh递归直连拓扑网络 实现NPU全互联 以64卡为步长扩展 最大支持8192卡无收敛全互联[4] - 发布业界首款企业级风冷AI超节点服务器Atlas 850 搭载8张昇腾NPU 支持多柜部署形成1024卡集群 是业内唯一风冷机房超节点解决方案[4] - 推出AI标卡Atlas 350 采用昇腾950PR芯片使向量算力提升2倍 推荐推理场景性能提升2.5倍 支持4个灵衢端口互联实现资源池化[5] - 推出业界首款通算超节点Taishan 950 SuperPoD 具备370纳秒超低时延和2.8T超大带宽 显著提升数据库及大数据业务性能[5] 技术开放策略 - 全面开放灵衢协议和超节点参考架构 允许产业界基于技术规范自研相关产品或部件[6] - 开放NPU模组、风冷/液冷刀片、AI标卡、CPU主板等基础硬件 支持客户进行增量开发和产品设计[6] - 将操作系统灵衢组件全部开源 代码合入openEuler等开源社区 支持用户集成到现有系统并自行迭代维护[9] - CANN全面开源开放 Mind系列组件同步开源 优先支持PyTorch和vLLM等主流开源框架[9] 全场景算力布局 - 超节点产品覆盖大型数据中心、企业级数据中心和小型工作站等全场景算力需求[1] - 通过硬件开放和软件开源策略支持伙伴打造行业场景化解决方案 加速开发者自主创新[1][9] - 致力于与产业界共筑全场景算力底座 推动超节点技术走向普惠与协同创新[6][10]
华为宣布推出超节点架构,可将多台物理机器深度互联
新浪科技· 2025-09-18 06:39
产品发布 - 华为推出创新的超节点架构 实现多台物理机器深度互联 逻辑层面像一台机器一样学习 思考与推理 [2] - 发布标卡 模组 服务器 集群等多款超节点产品 包括全液冷数据中心AI超节点Atlas 950 SuperPoD 企业级风冷AI超节点服务器Atlas 850和Atlas 860 AI新一代标卡Atlas 350 业界首个通算超节点Taishan 950 SuperPoD [2] 技术特性 - 超节点架构基于灵衢互联协议 具备资源池化 规模扩展 长稳可靠的关键特性 [2] - 实现计算 存储单元的大带宽和低时延互联 通过统一协议和内存编址 使有效算力能够随集群规模线性扩展 并大幅提升集群可靠性 [2] 生态战略 - 华为坚持硬件开放 软件开源 支持伙伴打造面向行业的超节点场景化解决方案 [2] - 全面开放超节点技术 与产业界共享技术红利 共同推动超节点技术走向普惠与协同创新 [3] - 操作系统灵衢组件全部开源 组件代码将陆续合入openEuler等多个上游操作系统开源社区 [3] 应用场景 - 昇腾围绕超节点架构打造全系列产品 满足大型数据中心 企业级数据中心和小型工作站等全场景算力需求 [2]
2025开放计算技术大会举行,加速AIDC全球协作
中国新闻网· 2025-08-11 11:03
开放计算技术大会概况 - 2025开放计算技术大会在北京举行 聚焦MoE大模型与AI智能体技术发展趋势及开放计算对纵向扩展性能与横向扩展效率协同发展的促进作用 [1] - 大会由开放计算社区OCP及开放标准组织OCTC联合主办 吸引中国移动 字节跳动 阿里云 三星 浪潮信息 清华大学 立讯技术等超千位学者 专家及厂商代表参与 [1] 开源开放趋势与产业协作 - 模型算法开源和算力系统开放成为AI时代主流趋势 开源开放全球化协作平台通过提升单系统性能满足万亿参数大模型需求 并通过全球产业链协作解决GW级AI数据中心系统性工程挑战 [1] - 开源大模型与开放算力结合驱动海量长尾应用爆发 加速AI普惠实现 公共云平台和模块化AI基础设施普及为开源模型规模化落地提供开放算力基础 [2] - 产业协同创新需从应用和用户思维出发 坚持标准引领 制定落地规范标准 推动数据中心技术创新与成果普惠 [2] OCP战略重点与技术成果 - OCP工作重心转向AI主导 所有核心工作围绕AI开放系统战略计划展开 涵盖数据中心物理基础设施 IT基础设施和系统管理三大重点领域 [2] - OCP发布《可扩展基础设施的蓝图》 作为AI开放系统战略计划重要工作成果 [2] - OCTC推动服务器算力算效评估基准 通过系统评估服务器整机算力与能效表现 为行业提供科学可信评估体系 为用户服务器架构选型优化提供标准范式 [2] MoE大模型驱动算力架构变革 - MoE大模型参数量保持高速增长且迭代迅速 对单系统算力密度与互联速率提出极致要求 带动计算架构变革 [3] - 超节点架构成为核心发展路径 需为AI重构算力系统以解决超大规模MoE带来的算力 互联 能耗瓶颈及可靠性稳定性挑战 [3] - 超节点架构采用GPU发起式直连内存 通过GPU友好型介质与存储减少内存瓶颈 为大模型训练推理提供支持 [3] 开放计算生态与系统化创新 - 开放计算使数据中心产业链协同效应更紧密 融合创新能力更强 对AI产业至关重要 [3] - 产业链各方以开放心态共建标准 共享技术 共拓场景 使多样性算力从分散"孤岛"变为互联互通"大陆" [3] - 超节点架构是系统化思维产物 从系统层面打破芯片性能边界最大化用户价值 浪潮信息将向社区开放自研超节点架构设计及PD分离框架 [4][5] 跨社区合作与GW级数据中心发展 - GW级AI数据中心推动算力生态变革 加速跨社区合作进程 OCP筹备成立"GW级开放智算中心OCP中国社区小组" 结合中国能源 算力基础设施与供应链优势推动AI开放系统战略落地 [5] - OCP与OCTC合作探讨将OCP领先AI基础设施技术架构 参考方案及前沿研究成果在中国市场落地 建立GW级AI数据中心全球性标杆 [5]