Workflow
算力调度
icon
搜索文档
2025年算力调度平台行业:优化计算资源,支撑AI应用
头豹研究院· 2025-08-22 12:29
行业投资评级 - 报告未明确提供行业投资评级 [1] 核心观点 - 人工智能技术迅猛发展推动全球算力需求指数级增长 需要算力调度实现跨地域 跨平台的资源整合与优化 [2] - 中国算力规模快速增长 2024年总规模达280EFLOPS 智能算力占比32% 数据生产总量达41.06ZB 同比增长25% [20][23][25] - 算力调度平台通过基础设施层 管理编排层 服务运营层和算力应用层四层架构 实现算力资源的高效整合与智能调度 [40][41] - 异构算力调度面临资源异构性 软件环境碎片化 跨架构迁移成本高 缺乏统一标准等核心挑战 [4][43][44][45][46] - 国内算力调度平台形成国家级 省级/跨省级 市级三级体系 运营商主导平台侧重跨区域资源整合 科技企业主导平台聚焦垂直领域 [5][48][49][50] - 开源算力调度技术平台中 openFuyao在国产化适配支持上具有优势 Kubernetes和Slurm分别在云原生和HPC领域有深厚积累 [6][52] 算力调度行业综述 算力定义与分类 - 算力指计算机设备或数据中心处理信息的能力 狭义以FLOPS衡量 广义包括数据存储 网络传输 任务调度等能力 [15][17] - 算力分为通用算力(基于CPU 适用云计算 边缘计算) 智能算力(基于GPU/FPGA/ASIC 专为AI任务设计) 超算算力(基于超级计算机 解决复杂工程问题) [18][19] 算力规模与数据生产 - 中国算力总规模从2020年135EFLOPS增长至2024年280EFLOPS 智能算力占比从20.7%提升至32% [20][21][23] - 2024年中国数据生产总量达41.06ZB 同比增长25% 增速较2023年提高2.56个百分点 智能应用推动数据量增长40.95% [25][26] 算力网络与算网融合 - 算力网络是以算为中心 网为根基的新型信息基础设施 实现算力按需分配和灵活调度 [27][28] - 算网融合是计算与网络资源在硬件 软件 平台 应用等多层面的深度整合 追求算力即插即用和网络按需适配 [27][29] - 中国移动算网融合架构分为基础设施层(物理底座) 编排管理层(调度中枢) 运营服务层(能力平台)三层 [30][31] 异构算力定义与分类 - 异构算力通过结合CPU GPU FPGA ASIC等不同架构处理器 提升整体计算性能 能效比和灵活性 [33][36] - 处理器按架构分为CPU(灵活性高) GPU(并行能力强) FPGA(可编程) DSA(特定领域性能高) ASIC(性能最优但无灵活性) [34][36] 算力调度平台与异构计算调度系统 - 算力调度平台面向多类型计算资源 解决宏观资源分配问题 异构计算调度系统针对异构硬件架构 解决微观任务优化问题 [37][39] - 两者关系为异构计算调度系统构建于算力调度平台的基础能力之上 实现硬件抽象 资源池化 细粒度调度等核心扩展能力 [38] 算力调度平台架构与技术 - 算力调度平台技术架构分为基础设施层(整合计算 存储 网络资源) 管理编排层(统一管控 智能调度) 服务运营层(算力交易与服务运营) 算力应用层(多行业场景) [40][41] - 关键技术包括算力感知(实时监测资源状态) 算力度量(量化评估异构资源) 算力路由(任务流量路由至最优节点) 算网编排(计算与网络资源统一编排) 算力交易(智能公平交易) [41] 异构算力调度挑战 - 资源异构性与软件环境差异增加调度复杂性 任务代码需适配目标硬件编程接口 [43] - 跨架构任务迁移需重写代码或调整算法 受限于不同硬件内存管理机制和专用开发工具链 [44] - 缺乏统一计量标准和接口规范 跨厂商作业调度生态支持能力弱导致资源利用率受限 [45] - 异构硬件性能受多重因素影响呈非线性动态变化 传统调度模型无法精准预测任务执行损耗 [46] 国内主要算力调度平台 - 国家级平台包括全国一体化算力算网调度平台(首个人工智能公共算力开放创新平台(9家建设+16家筹建) 东数西算一体化算力交易平台 北京算力互联互通和运行服务平台 国家超级计算中心体系(天津"天河" 广州"天河二号" 济南"神威" 无锡"曙光"等) [48] - 省级/跨省级平台覆盖长三角(长三角一体化示范区异构智算云网调度平台) 粤港澳大湾区(粤港澳大湾区算力调度平台) 成渝(四川省算力调度服务平台) 京津冀(山东省黄河工业算力调度服务平台)等重点区域 [48] - 市级平台包括深圳市智慧城市算力统筹调度平台 杭州市算力资源调度服务平台 武汉市算力公共服务平台 青岛市算力调度服务平台 天津市算力交易中心等 [48] - 运营商主导平台如中国电信"息壤"算力分发网络平台 中国移动云智能算力调度平台(基于"4+N+31+X"梯次化布局) 中国联通云星罗先进算力调度平台(千卡级集群管理能力) 依托全国网络覆盖整合跨区域异构算力资源 [50] - 科技企业主导平台如中科曙光一体化算力交易调度平台 阿里云震旦异构计算平台 百度百舸AI异构计算平台 华为公共多样性算力服务平台 浪潮AI计算系统及推理平台(千卡集群线性加速比96%) 聚焦垂直领域或特定技术 [50] 开源算力调度技术平台 - openFuyao由华为 中国移动 联通等主导 支持CPU/GPU/FPGA多架构算力统一调度 优化大规模集群资源利用率 计划2025年Q3正式开源 [52] - Kubernetes是云原生容器编排平台 支持自动调度与扩缩容 服务发现与负载均衡 多集群管理 [52] - Slurm是HPC领域作业调度系统 支持分区管理 资源隔离 公平调度 [52] - Volcano是Kubernetes批处理调度插件 专为AI/大数据优化 支持Gang调度和多集群调度 [52] - YARN是Hadoop生态资源调度框架 支持资源抽象 多框架兼容(MapReduce Spark) 弹性资源分配 [52]
晚报 | 7月30日主题前瞻
选股宝· 2025-07-29 14:37
数据中心 - 英伟达向台积电订购30万颗H20芯片,因中国需求强劲,改变原依赖库存计划[1] - 字节跳动、腾讯、阿里等互联网厂商数据中心建设诉求加速,资本开支或上修,字节2025年或增购10万卡H20,腾讯需求2万-5万卡[1] - 短期建设需求打破柴发行业6个月交付周期,转向溢价寻求短期产能,机构预测招标价格上涨10-20W/台,100张H20对应5000台柴发需求,等于过去12个月新签订单体量[1] AI基建 - 字节跳动发布华东和华北区域微模块数据中心招采计划,计划2025年7月启动,为AIDC战略关键部分,支持AI大模型训练[2] - 公司2025年资本开支达1600亿元,其中900亿元用于AI算力采购,700亿元用于IDC基建及网络设备招标[2] - 招采计划契合H20芯片解禁窗口期,推动液冷、柴发、服务器等产业链需求爆发[2] 算力调度 - 全国首个智能存力调度平台在WAIC大会上落地,覆盖长三角、成渝等四大国家级枢纽节点,解决数据存储"存得下、流得动、用得好"难题[3] - 平台通过异构资源整合、动态调度和跨域加速技术,为全国一体化数据中心建设与AI技术落地筑牢基础[3] - 平台优化资源配置,增强网络稳定性,加速数据流通与价值挖掘,催生新业态[3] 华为鸿蒙 - 华为仓颉编程语言将于7月30日开源,上线编译器与标准库,主打原生智能、全场景适配与高性能[4] - 该语言为鸿蒙生态基础设施重要一环,支持全场景应用开发,集成现代语言特性和编译优化[4] 行业动态 - 上海市印发公共充电网络建设划分方案,明确2025年"发展区""保持区"和"调控区"[6] - 江苏省医保局公示脑机接口医疗服务价格项目[6] - 渣打集团与阿里巴巴达成战略合作,推进金融服务与AI技术融合[6] 市场热点 - 光通信板块受谷歌、Meta提高资本开支影响[10] - 雅江电站概念股因雅鲁藏布江下游水电工程开工(总投资1.2万亿)受关注[10] - 机器人板块因世界人工智能大会及年内首家十倍股出现受关注[10] - 军工板块因9月阅兵及北约军费提至GDP5%受关注[11] - 清华团队开发出理想EUV光刻胶材料,PCB板行业新技术Cowop将芯片封装于PCB板[12]
行业简报:算力调度平台规模化发展-Deepseek带动算力需求井喷,算力调度平台成最优解
头豹研究院· 2025-06-06 12:33
报告行业投资评级 未提及 报告的核心观点 在AI大模型驱动下,中国智能算力需求与供给同步高速攀升,具备高效资源整合与调度能力的平台,将具备突出的规模化发展价值;算力调度中心的盈利高度依赖政府补贴,企业需战略性早期介入并契合政府多维核心价值;平台需具备高效整合和调度各地异构算力的技术能力;算力平台规模化价值变现的核心在于庞大且多元的客户基础,结合高效的生态合作与增值服务策略 [10]。 根据相关目录分别进行总结 算力需求增长迅速 - 中国智能算力需求与供给同步高速攀升,超大规模、高性能算力中心加速布局,带动整体算力基础设施快速扩容,具备高效资源整合与调度能力的平台有突出规模化发展价值 [10][11] - 智能算力需求在大模型应用领域激增,大模型需求占比接近60%,反映AI技术快速发展和未来算力市场巨大潜力 [14] - 互联网巨头和超大规模云服务提供商持续扩展算力中心,预计至2028年,中国智能算力整体需求将超20,000MW [16] 算力调度平台的价值 - 算力调度平台通过统一架构智能整合异构资源,核心价值在于提升利用率、降低使用门槛、简化算力获取流程,实现高效便捷的服务供给 [20] - 解决资源“碎片化”与“利用率低”痛点,汇聚碎片化、异构算力,通过智能调度提升整体资源利用率与可及性 [19] - 降低用户“成本”并提升“灵活性”,提供弹性、按需、高性价比的算力使用模式,显著降低用户成本和获取门槛 [19] - 简化算力“获取与管理复杂度”,统一管理并智能匹配算力与任务需求,简化用户操作,优化资源分配效率 [19] 政府补贴是核心来源 - 政府补贴是驱动算力调度中心商业模式及盈利的关键,政府核心诉求是确保本地已建算力资源充分利用,并通过结构化补贴机制激励用户、降低平台风险 [30] - 企业要成功赢得政府订单,需战略性早期介入以影响决策,精准把握、满足政府在经济、社会效益及政绩等多维度的核心价值诉求 [30] 优质算力调度平台技术特征 - 平台需具备精细化资源切片、异构算力兼容、跨地区调度、实时监控与动态调度等能力,实现算力资源的高效复用和低成本变现 [38] - 细粒度切片,将整块算力资源精准拆分为小单元,满足不同客户多样化需求,实现闲置资源充分复用 [33][38] - 异构算力兼容能力,具备兼容性,通过资源虚拟化技术统一调度不同芯片架构,确保用户体验不受硬件差异影响 [36][38] - 跨地区调度能力,整合各地区算力资源,实现资源跨区域调度,降低单一地区资源不足或故障的风险 [34][38] - 实时监控与动态调度能力,建立完善监控系统,实时跟踪客户算力使用状态,动态调整和打包复用闲置算力,提升资源利用率和收入 [37][38] - 潮汐调度能力,根据客户需求波动和使用高峰低谷,合理安排任务分配,实现资源高效变现 [35][38] 算力调度中心规模化的核心 - 算力平台需依托庞大且多元的客户基础,并结合高效的生态合作与增值服务策略,实现算力的规模化价值变现 [42] - 足够大的客户规模是快速盈利和达成目标的基础,高价值、需求稳定的大客户是核心目标,促使平台就近部署以优化服务 [42] - 客户群的丰富性允许通过分层定价实现算力溢价,最大化整体收益 [42] - 通过合作生态转型为“批发商”,聚焦高毛利算力销售并由伙伴完成低毛利交付,有效控制风险、提升利润 [42] - 在基础算力之上提供存储、网络等增值服务进行交叉销售,增加收入,提升客户粘性与终身价值 [42]
南方电网申请基于容器编排平台算力调度机制任务处理方法等专利,提高任务的处理效率
金融界· 2025-05-24 09:45
公司专利技术 - 公司申请了一项名为"基于容器编排平台的算力调度机制的任务处理方法、装置、计算机设备和存储介质"的专利,公开号CN120029785A,申请日期为2025年02月 [1] - 专利涉及从异构算力资源提取关键属性信息,调整容器编排平台组件,并将异构与同构算力资源作为候选资源,根据任务需求分配目标算力资源进行处理 [1] 公司背景与经营数据 - 公司成立于2004年,总部位于广州市,主营业务为电力、热力生产和供应业 [2] - 公司注册资本达902亿人民币,对外投资35家企业,参与招投标项目5000次 [2] - 公司拥有商标信息352条,专利信息4985条,行政许可65个 [2]