Workflow
开放式集群算力
icon
搜索文档
“中国智算产业,需要苹果,也需要安卓”
观察者网· 2025-09-07 15:01
行业背景与挑战 - 国内AI算力领域面临高端算力供给不足、国产加速卡性能差距大、算力成本高、自主软硬件生态不成熟等严峻问题 [1] - 发展更大更高效智算集群以弥补单卡性能差距成为重要创新方向 [1] - 需通过开放式跨层协作优化打造开放式、标准化、高效率集群算力 [1] 战略合作与生态建设 - 中科曙光协同AI芯片、AI整机、大模型等20多家产业链企业共同发布国内首个AI计算开放架构 [1] - 公司联合产业链企业依托国家先进计算产业创新中心启动"AI计算开放架构联合实验室"建设 [1][6] - 开放架构旨在联动AI产业链企业从"算、存、网、电、冷、管、软"单点突破走向集群创新 [1] 技术产品发布 - 基于AI计算开放架构设计的曙光AI超集群系统同期发布 [3] - 系统支持多品牌加速卡 [3] - 系统具备超高性能、超高效率、超高可靠、全面开放四大特征 [3] - 单机柜支持96加速卡、百P级AI算力,最大可实现百万卡大规模扩展 [5] 性能表现 - 千卡集群大模型训推性能达到业界主流水平2.3倍 [5] - 模型开发效率提升高达4倍 [5] - GPU算效增加55% [5] - 平均无故障时间(MTBF)提高2.1倍 [5] - 平均故障修复时间(MTTR)降低47% [5] 技术开放与支持 - 公司联合芯片、整机等企业开放覆盖部件级、系统层、基础设施层、软件层和数据集五个层面的关键技术能力 [5] - 首批开放AI存储优化能力、液冷基础设施设计规范、DeepAI基础软件栈三项技术能力 [5] - 开放措施旨在减少重复研发,降低中小企业研发门槛 [5] 产业生态价值 - 系统可适配支持多品牌GPU加速卡,兼容CUDA等主流软件生态 [5] - 开放架构可大幅降低硬件成本和软件开发适配成本,保护用户前期投资 [5] - 公司累计部署超50万张异构加速卡,建设过20多个大规模算力集群 [1]