openFuyao

搜索文档
2025年算力调度平台行业:优化计算资源,支撑AI应用
头豹研究院· 2025-08-22 12:29
行业投资评级 - 报告未明确提供行业投资评级 [1] 核心观点 - 人工智能技术迅猛发展推动全球算力需求指数级增长 需要算力调度实现跨地域 跨平台的资源整合与优化 [2] - 中国算力规模快速增长 2024年总规模达280EFLOPS 智能算力占比32% 数据生产总量达41.06ZB 同比增长25% [20][23][25] - 算力调度平台通过基础设施层 管理编排层 服务运营层和算力应用层四层架构 实现算力资源的高效整合与智能调度 [40][41] - 异构算力调度面临资源异构性 软件环境碎片化 跨架构迁移成本高 缺乏统一标准等核心挑战 [4][43][44][45][46] - 国内算力调度平台形成国家级 省级/跨省级 市级三级体系 运营商主导平台侧重跨区域资源整合 科技企业主导平台聚焦垂直领域 [5][48][49][50] - 开源算力调度技术平台中 openFuyao在国产化适配支持上具有优势 Kubernetes和Slurm分别在云原生和HPC领域有深厚积累 [6][52] 算力调度行业综述 算力定义与分类 - 算力指计算机设备或数据中心处理信息的能力 狭义以FLOPS衡量 广义包括数据存储 网络传输 任务调度等能力 [15][17] - 算力分为通用算力(基于CPU 适用云计算 边缘计算) 智能算力(基于GPU/FPGA/ASIC 专为AI任务设计) 超算算力(基于超级计算机 解决复杂工程问题) [18][19] 算力规模与数据生产 - 中国算力总规模从2020年135EFLOPS增长至2024年280EFLOPS 智能算力占比从20.7%提升至32% [20][21][23] - 2024年中国数据生产总量达41.06ZB 同比增长25% 增速较2023年提高2.56个百分点 智能应用推动数据量增长40.95% [25][26] 算力网络与算网融合 - 算力网络是以算为中心 网为根基的新型信息基础设施 实现算力按需分配和灵活调度 [27][28] - 算网融合是计算与网络资源在硬件 软件 平台 应用等多层面的深度整合 追求算力即插即用和网络按需适配 [27][29] - 中国移动算网融合架构分为基础设施层(物理底座) 编排管理层(调度中枢) 运营服务层(能力平台)三层 [30][31] 异构算力定义与分类 - 异构算力通过结合CPU GPU FPGA ASIC等不同架构处理器 提升整体计算性能 能效比和灵活性 [33][36] - 处理器按架构分为CPU(灵活性高) GPU(并行能力强) FPGA(可编程) DSA(特定领域性能高) ASIC(性能最优但无灵活性) [34][36] 算力调度平台与异构计算调度系统 - 算力调度平台面向多类型计算资源 解决宏观资源分配问题 异构计算调度系统针对异构硬件架构 解决微观任务优化问题 [37][39] - 两者关系为异构计算调度系统构建于算力调度平台的基础能力之上 实现硬件抽象 资源池化 细粒度调度等核心扩展能力 [38] 算力调度平台架构与技术 - 算力调度平台技术架构分为基础设施层(整合计算 存储 网络资源) 管理编排层(统一管控 智能调度) 服务运营层(算力交易与服务运营) 算力应用层(多行业场景) [40][41] - 关键技术包括算力感知(实时监测资源状态) 算力度量(量化评估异构资源) 算力路由(任务流量路由至最优节点) 算网编排(计算与网络资源统一编排) 算力交易(智能公平交易) [41] 异构算力调度挑战 - 资源异构性与软件环境差异增加调度复杂性 任务代码需适配目标硬件编程接口 [43] - 跨架构任务迁移需重写代码或调整算法 受限于不同硬件内存管理机制和专用开发工具链 [44] - 缺乏统一计量标准和接口规范 跨厂商作业调度生态支持能力弱导致资源利用率受限 [45] - 异构硬件性能受多重因素影响呈非线性动态变化 传统调度模型无法精准预测任务执行损耗 [46] 国内主要算力调度平台 - 国家级平台包括全国一体化算力算网调度平台(首个人工智能公共算力开放创新平台(9家建设+16家筹建) 东数西算一体化算力交易平台 北京算力互联互通和运行服务平台 国家超级计算中心体系(天津"天河" 广州"天河二号" 济南"神威" 无锡"曙光"等) [48] - 省级/跨省级平台覆盖长三角(长三角一体化示范区异构智算云网调度平台) 粤港澳大湾区(粤港澳大湾区算力调度平台) 成渝(四川省算力调度服务平台) 京津冀(山东省黄河工业算力调度服务平台)等重点区域 [48] - 市级平台包括深圳市智慧城市算力统筹调度平台 杭州市算力资源调度服务平台 武汉市算力公共服务平台 青岛市算力调度服务平台 天津市算力交易中心等 [48] - 运营商主导平台如中国电信"息壤"算力分发网络平台 中国移动云智能算力调度平台(基于"4+N+31+X"梯次化布局) 中国联通云星罗先进算力调度平台(千卡级集群管理能力) 依托全国网络覆盖整合跨区域异构算力资源 [50] - 科技企业主导平台如中科曙光一体化算力交易调度平台 阿里云震旦异构计算平台 百度百舸AI异构计算平台 华为公共多样性算力服务平台 浪潮AI计算系统及推理平台(千卡集群线性加速比96%) 聚焦垂直领域或特定技术 [50] 开源算力调度技术平台 - openFuyao由华为 中国移动 联通等主导 支持CPU/GPU/FPGA多架构算力统一调度 优化大规模集群资源利用率 计划2025年Q3正式开源 [52] - Kubernetes是云原生容器编排平台 支持自动调度与扩缩容 服务发现与负载均衡 多集群管理 [52] - Slurm是HPC领域作业调度系统 支持分区管理 资源隔离 公平调度 [52] - Volcano是Kubernetes批处理调度插件 专为AI/大数据优化 支持Gang调度和多集群调度 [52] - YARN是Hadoop生态资源调度框架 支持资源抽象 多框架兼容(MapReduce Spark) 弹性资源分配 [52]
华为KubeCon China 2025:驱动云原生向AI原生技术融合跃迁
环球网· 2025-06-19 06:59
云原生与AI融合技术大会 - KubeCon+CloudNativeCon China 2025在香港召开,聚焦云原生与AI融合的最新进展与未来趋势 [1] - 华为深度参与大会,带来3场主题演讲及10多个技术分会场分享,展示云原生与AI融合领域的突破性成果 [1] - 开源生态加速AI时代技术跃迁,汇聚全球智慧、缩短创新周期、催化创新应用落地 [1] 华为云原生AI技术实践 - 华为提出AI时代算力集群技术演进趋势,包括异构集群管理、超大规模集群调度、云边协同AI等领域的应用实践 [1] - 华为通过openEuler、Volcano、Karmada、KubeEdge、openFuyao五大项目实现全栈开源,帮助企业优化AI集群 [3] - 华为云原生开源解决方案支持PyTorch/TensorFlow/MindSpore等主流框架及大语言模型开发场景 [3] 企业AI应用案例 - B站构建以Volcano和Karmada为核心的调度框架,支持上亿月活用户的AI工作负载,提升资源利用率 [4][6] - 科大讯飞借助Volcano实现GPU利用率提升40%以上,故障恢复时间缩短70%,资源干扰率降低50% [7] - Bloomberg利用Karmada构建弹性数据分析平台,证明其在大规模数据平台中的可靠性 [12] 云原生技术创新 - Volcano是CNCF首个批量计算项目,新增HyperNode网络拓扑感知调度策略,提升AI训练和推理效率 [9] - Karmada支持应用跨集群滚动更新、有状态应用故障迁移等特性,解决多集群编排难题 [10] - KubeEdge作为CNCF首个云原生边缘计算毕业级项目,支持智慧物流、机器人编排等边缘场景 [12][14] 高性能技术解决方案 - Kmesh是内核级云原生流量治理引擎,采用eBPF技术实现高性能、低开销的Sidecarless方案 [14][16] - openGemini是高性能时序数据库,已在9大领域应用落地,支持数据多副本及流式计算新特性 [16][18] - openFuyao打造多样化算力互联的集群管理与调度体系,促进AI和大数据场景的高效算力释放 [18] 华为全栈生态布局 - 华为展示AI-Native云原生基础设施,包括UCS、CCI、CCE Autopilot等行业级产品 [20] - 华为构建覆盖底层硬件、操作系统、数据库到AI框架的全栈能力,提供"算力+生态"一体化基础设施 [20] - 华为通过openEuler、openGauss、MindSpore等开源项目为世界提供第二选择 [20]
夯实算力底座 加速AI应用
人民日报海外版· 2025-05-29 23:04
鲲鹏昇腾开发者大会2025概况 - 大会在北京中关村国际创新中心举办,展示区面积达2000多平方米,包含2场峰会、40多场技术分论坛[4][6] - 截至2025年5月,鲲鹏昇腾已发展超过665万开发者,8800多家合作伙伴,完成23900多个解决方案认证[5] - 大会注重技术深度讲解和代码实操,设置创享周进行12场线上直播,聚焦AI热点话题[6] 技术发布与平台升级 - 鲲鹏推出AI+解决方案,发布开源社区openFuyao,构建人工智能计算引擎[7] - 昇腾发布CATLASS算子模板库,升级大规模专家并行推理解决方案,提升算子开发效率和模型训练性能[7] - 华为持续优化异构融合算力架构,将计算能力沉淀到软硬件平台开放给开发者[6][7] 行业应用案例 - 昇腾联合100多家伙伴打造DeepSeek方案,覆盖互联网、金融、教育、医疗等行业核心场景[9] - 纺织行业应用昇腾家纺大模型,设计成本从数万元降至几十元,开发周期缩短至5天[10] - 教育行业利用昇腾算力构建AI智能体教学解决方案,开发AI助教、命题工具等应用[10] - 制造业应用昇腾AI算力实现机械臂集群动态调度,故障时产线效率仅下降3%[11] 开发者生态建设 - 华为推出专项激励计划覆盖技术研发到商业落地全链条,联合200家企业和50所高校打造产学研共同体[12] - 昇腾社区2025年将升级课程体系,提供更多开发板和算力资源,构建学练训赛完整体系[13] - 昇腾AI创新大赛设立三大旗舰赛道和两大子赛事,吸引全球数万开发者参与[13] 市场前景与战略 - Gartner预测到2027年80%中国企业将部署多模型生成式AI,2029年60%企业将AI作为收入主要驱动力[9] - 华为推进全面智能化战略,通过鲲鹏昇腾计算生态赋能千行万业[9] - AI在制造业正从探索验证向深度应用阶段加速迈进,华为深化"AI+生产""AI+供应"融合[11]
鲲鹏昇腾开发者大会2025:华鲲振宇AI全栈能力构建AI开发新范式
搜狐财经· 2025-05-29 11:44
鲲鹏昇腾开发者大会2025 - 大会以"心怀挚爱,共绽光芒"为主题,在北京中关村国际创新中心举办,华鲲振宇作为鲲鹏&昇腾生态唯一战略级伙伴,全景呈现AI全栈解决方案,携手华为及开发者推动国产化算力自主创新和多样化算力集群软件生态建设 [1] 自研元启AI开发平台 - 华鲲振宇开放自研元启AI开发平台体验,开发者可通过零代码构建智能体、自动化生成知识图谱、图形化流程编排等功能,降低AI应用开发门槛 [2][4] - 该平台让开发者像搭积木一样搭建个人/企业智能体,有效解决AI应用开发门槛高的问题,助力企业实现大模型应用 [4] 算力创新产品 - 华鲲振宇"卡多多"AT9508 G3推理服务器亮相鲲鹏展区,基于鲲鹏创新架构,支持生态内最高规格的10卡双宽扩展 [6] - 该服务器支持国产开源模型从7B到671B的部署,预算从数万元到数百万元灵活配置,已在政务、金融、能源等关键领域实现规模化应用 [6] openFuyao开源社区 - 华为联合华鲲振宇等六家单位发布多样化算力集群软件开源社区openFuyao [8] - 华鲲振宇副总裁赵彦钧入选筹备委员会成员,AI开发部部长徐洋入选技术委员会,深度参与社区长期发展与技术路线规划 [8] - 华鲲振宇基于openFuyao技术构建天巡CubeX智擎平台,解决行业模型部署碎片化难题,通过异构算力调度与百模管理能力提升集群资源利用率 [10] 公司未来规划 - 华鲲振宇将持续深耕"鲲鹏+昇腾"根技术,联合华为、开发者及产业伙伴推动国产算力创新 [10] - 公司将以场景化解决方案共绘AI时代新图景,提供多样化的算力选择 [10]
通信行业周观点:大模型密集发布,AI与算力主线景气延续-20250526
长江证券· 2025-05-26 09:14
报告行业投资评级 - 看好丨维持 [11] 报告的核心观点 - 2025年第21周通信板块下跌1.85%,年初以来下跌4.71%,在长江一级行业中均排名第26位;海外谷歌和Anthropic发布新模型,国内华为AI工具链更新,AI与算力主线景气延续,驱动数据中心通信需求上行,当前电信业务板块估值仍处低位,行业整体配置性价比较高 [2][5][9] 根据相关目录分别进行总结 板块行情 - 2025年第21周通信板块下跌1.85%,年初以来下跌4.71%,在长江一级行业中均排名第26位 [2][5] - 通信板块内市值80亿元以上公司中,本周涨幅前三为东土科技(+14.5%)、海格通信(+12.8%)、梦网科技(+11.7%),跌幅前三为联特科技(-10.5%)、太辰光(-10.2%)、剑桥科技(-8.9%) [5] 行业动态 - 2025年5月20 - 21日谷歌召开开发者大会,发布Gemini 2.5系列大模型及“AI模式”搜索体验,推出多模态相关项目和模型,发布订阅制Gemini Ultra,Gemini生态覆盖多平台 [6] - 2025年5月22日Anthropic推出Claude 4系列两款新模型,强化编码等核心功能,Claude Code编程助手上线 [7] - 2025年5月23 - 24日鲲鹏昇腾开发者大会举办,华为聚焦“算力+AI融合”,推进双引擎战略,工具链迭代,生态覆盖超665万开发者,昇腾平台在多场景落地能力强化 [8] 投资建议 - 运营商重点推荐中国移动、中国电信、中国联通 [9] - 光模块重点推荐中际旭创、新易盛、天孚通信,重点关注太辰光、仕佳光子 [9] - 国产算力重点推荐烽火通信、华丰科技、英维克、润泽科技、光迅科技、中兴通讯、紫光股份,关注科华数据、奥飞数据 [9] - 物联网推荐和而泰、拓邦股份、移远通信、美格智能、翱捷科技 [9] - 卫星应用重点推荐海格通信、华测导航,建议关注铖昌科技 [9] 公司营收及业绩增速 - 报告列出通信行业板块重点公司2024年和2025年Q1营收及业绩增速等数据,如中国移动2024年营收同比增速3.1%,2025年Q1营收同比增速0.0%等 [16]
国产算力支撑智能化提速,鲲鹏、昇腾开发者已超665万
北京日报客户端· 2025-05-25 11:22
华为鲲鹏昇腾开发者大会2025核心成果 - 截至2025年5月鲲鹏昇腾生态已发展665万开发者、8800家合作伙伴、完成23900个解决方案认证 [1] - 公司持续投入根技术创新和系统架构创新以打造开放繁荣的计算产业生态 [1] - 鲲鹏正式推出鲲鹏AI+解决方案并开源openFuyao算力集群软件社区 [1] AI计算行业发展趋势 - 行业智能化加速推动AI平台需提升易用性、灵活性和可扩展性 [1] - 模型算法与算力调度模式快速迭代需高效稳定的训练算力系统支撑 [1] - 大模型发展呈现架构优化和工程创新提升模型效率的新趋势 [1] 昇腾超节点架构技术突破 - 突破集群互联瓶颈实现节点间高效协同使算力集群运行如单台计算机 [2] - 384卡高速总线互联体系实现训练性能提升3倍 [2] - 技术创新支撑大规模AI任务快速推进 [2]
华为周军:鲲鹏、昇腾已发展超过665万开发者,8800多家合作伙伴
新浪科技· 2025-05-25 05:20
生态发展 - 鲲鹏昇腾开发者大会2025发布一系列新技术、新工具和新平台,旨在使能伙伴和开发者高效开发 [1] - 华为ICT Marketing部部长周军强调公司坚持"硬件开放、软件开源、使能伙伴、发展人才"的生态策略,持续投入根技术创新和系统架构创新 [1] - 截至2025年5月,鲲鹏昇腾已发展超过665万开发者,8800多家合作伙伴,完成23900多个解决方案认证 [1] 通用计算领域 - 鲲鹏正式推出鲲鹏AI+解决方案,并开源发布多样化算力集群软件开源社区openFuyao [1] - AI Core方面提供鲲鹏+xPU推理方案,兼容昇腾及其他国产GPU,覆盖数据中心到边缘场景 [1] - AI Infra方面提供鲲鹏AI数据工程组件和安全组件,优化数据处理、检索性能及安全性 [1] AI应用解决方案 - 提供业务编排、部署、调度等能力,基于开源生态构建企业端到端AI解决方案 [2] - 发布鲲鹏搜广推解决方案,优化召回和排序,助力企业打造新一代智能推荐引擎 [2] - 发布鲲鹏RAG解决方案1.0,基于鲲鹏CPU和昇腾NPU、第三方GPU卡,构建开源开放体系 [2] - 6家企业基于鲲鹏RAG解决方案1.0推出行业差异化解决方案 [2] 集群管理与调度 - openFuyao宣布正式开源,聚焦"云原生+AI",提供多样化算力互联的集群管理与调度能力 [2] - openFuyao提供算力亲和组件及面向生产的社区发行版,实现集群算力的弹性调度和高效释放 [2] AI计算领域创新 - 昇腾发布CATLASS算子模板库、MindIE Motor推理服务加速库、推理微服务MIS [2] - 持续升级分层开放CANN能力、MindSpeed RL强化学习套件、大规模专家并行推理解决方案 [2] - 目标为简化算子开发、便捷应用部署、提升模型训练和推理效率 [2]
华为周军:鲲鹏、昇腾已发展超过665万开发者
快讯· 2025-05-23 14:45
鲲鹏昇腾开发者大会2025技术发布 - 鲲鹏AI+解决方案正式推出,面向通用计算领域构建AI时代卓越引擎 [1] - 开源发布多样化算力集群软件开源社区openFuyao [1] - 昇腾发布CATLASS算子模板库、MindIE Motor推理服务加速库、推理微服务MIS [1] - 持续升级分层开放CANN能力、MindSpeed RL强化学习套件、大规模专家并行推理解决方案 [1] 华为生态策略与成果 - 坚持"硬件开放、软件开源、使能伙伴、发展人才"的生态策略 [1] - 持续投入根技术创新和系统架构创新 [1] - 截至2025年5月已发展超过665万开发者、8800多家合作伙伴 [1] - 完成23900多个解决方案认证 [1] 算力底座建设 - 持续打造坚实、易用的算力底座 [1] - 使能开发者和伙伴加速行业智能化 [1]