Workflow
AI应用平台对接
icon
搜索文档
华为发布开源AI容器技术Flex:ai:让闲置算力“动起来”,把一张卡切给多任务使用丨最前线
36氪· 2025-11-25 13:54
文章核心观点 - 华为公司发布并开源AI容器技术Flex:ai,旨在通过三项技术创新解决“算力不够用”和“算力被浪费”并存的问题,提升算力资源利用率 [1] - 该技术通过对GPU、NPU等智能算力资源的精细化管理与智能调度,将零散算力统一成资源池,并智能分配不同规模的AI任务 [1] - 此次开源是华为与上海交通大学、西安交通大学、厦门大学产学合作的成果,旨在推动异构算力虚拟化与AI应用平台对接的标准构建 [1][2] 技术核心能力 - **XPU池化框架**:与上海交通大学联合研发,将单张GPU或NPU算力卡按10%的精度切分为多个虚拟算力单元,实现“用多少,切多少”,使小模型训练推理场景下的整体算力平均利用率提升30% [2] - **跨节点拉远虚拟化技术**:与厦门大学研发,可聚合集群内各节点的空闲XPU算力形成“共享算力池”,让不具备智能计算能力的通用服务器也能通过网络调用远端GPU/NPU资源参与AI计算 [2] - **Hi Scheduler智能调度器**:与西安交通大学共同推出,能感知集群里多品牌、多规格算力资源的状态,根据任务优先级、算力需求等参数自动选择资源,实现分时复用和全局最优调度 [2] 行业影响与目标 - 技术基于Kubernetes构建,通过对GPU、NPU等资源的精细化管理与智能调度,统一零散算力并智能分配AI任务 [1] - 全面开源将向产学研各界开发者开放所有核心技术能力,共同推动异构算力虚拟化与AI应用平台对接的标准构建,形成算力高效利用的标准化解决方案 [2]