Flex:ai
搜索文档
计算机行业周报:AI Infra:重点关注数据层软件及MaaS-20251129
申万宏源证券· 2025-11-29 15:20
报告投资评级 - 行业投资评级为“看好” [1] 报告核心观点 - AI基础设施(AI Infra)是AI工作负载的底层支撑系统,涵盖算力、存储、网络等五层架构,其核心目标是高效完成AI模型训练和推理 [3] - 生成式AI进入推理时代,AI Infra市场规模和渗透率显著提升,2025年预计成为中国AI Infra平台应用元年 [7] - 模型及应用管理层中,数据类基础设施软件将率先受益,海外厂商Snowflake、MongoDB的收入增速拐点已显现 [3][32] - AI基础设施厂商处于产业链“卖铲”位置,确定性高,具备高成长潜力 [3][51] AI Infra市场概况与架构 - 中国AI Infra平台市场规模2024年达34.5亿元,预计2025年跃升至67.3亿元,同比增长95.1% [7] - AI Infra包含三类核心软件:算力管理层(2024年市场份额64.6%)、模型管理层、应用管理层(占比持续提升) [11] - 一个完整的AI基础设施通常包含算力层、存储层、网络层、软件与中间件层、运维与管理层 [5] 算力管理层分析 - 国内AI Infra算力管理层软件参与者主要为云厂商(如阿里云、华为云、火山引擎)和MaaS初创公司 [12] - 算力调度环节至关重要,直接影响大模型厂商成本,1%的效率提升意义显著 [16] - 华为Flex:ai可实现异构算力调度,将单张GPU/NPU算力卡切分至10%粒度,算力资源平均利用率可提升30% [20][22][24] - 阿里巴巴Aegaeon通过token级动态调度,使10个模型所需GPU数量从1192个锐减至213个,资源节约率高达82% [26][28] 模型及应用管理层分析 - IDC预测2024年全球将涌现超过5亿个新应用,相当于过去40年间出现的应用数总和 [29] - 企业对私有化部署、数据整合需求迫切,数据类Infra软件先受益 [3][29] - MongoDB凭借原生支持结构化、半结构化与非结构化数据的统一存储能力,成为AI应用的理想平台,其AMP平台被视为未来增长点 [36] - Snowflake作为数据仓库推出AI数据平台,25%的已部署用例已整合AI功能,新客户中50%的签约受AI驱动 [38][43] 国内对标公司 - 达梦数据推出向量数据库,践行“智算多模”技术理念,实现图、关系、键值、文档、向量等数据模型的统一存储 [45] - 英方软件作为数据复制及灾备厂商,推出i2Stream实时数据流处理平台,满足AI大模型等领域对数据实时处理的需求 [48] 重点标的梳理 - 报告梳理了八大类重点标的,涵盖AIGC应用、数字经济领军、信创&数据、AIGC算力、数据要素、智联汽车、新型工业化、医疗信息化等领域 [52]
算力利用率提升30% 万兴科技(300624.SZ)等华为云合作方或受益
智通财经网· 2025-11-27 01:16
华为Flex:ai技术发布 - 华为正式发布并开源创新AI容器技术Flex:ai 该技术通过对GPU、NPU等智能算力资源的精细化管理与智能调度 实现AI工作负载与算力资源的精准匹配 [1] - 华为Flex:ai技术可将算力资源平均利用率提升30% 而目前行业平均利用率仅为30%至40% [1] - 新技术有助于解决偏高的算力成本与待优化的算力资源问题 在同等硬件投入下可生成更多内容 从而为AI应用企业降本 [1] 万兴科技AI能力与成本优势 - 万兴科技旗下万兴天幕AI生成一条5秒视频成本仅需0.5元 而市面上同类产品消耗约8.8元 成本优势显著 [1] - 公司AI服务器调用量截至今年前三季度已超8亿次 用户AI使用热情高增 [2] - 万兴科技业务覆盖全球200多个国家和地区 累计活跃用户突破20亿 [2] 万兴科技与华为合作及技术进展 - 万兴科技作为华为云合作伙伴 在算力、AI技术、产品应用落地等多个层面与华为云达成合作 [2] - 公司于今年6月联合华为云发布万兴天幕音视频多媒体大模型2.0 该模型依托百亿级数据沉淀 相比1.0版本性能平均提升约90% [2] - 万兴天幕2.0海外版ToMoviee 2.0 AI在VBench-2.0权威测评榜单中综合得分获全球前三 并在摄像机运动与运动合理性两项关键指标上摘得全球第一 [2] 行业影响与公司前景 - 华为算力新技术的突破有望使万兴科技等产业链企业借助合作先发优势 进一步增强其内容生成在成本上的竞争力 [1] - 华为新技术预计将对AI企业尤其是AI应用企业带来积极影响 [1]
算力利用率提升30%,华为与三大高校开源Flex:ai
凤凰网· 2025-11-26 13:49
技术发布与核心目标 - 华为联合上海交通大学、西安交通大学、厦门大学正式发布并开源AI容器技术Flex:ai,旨在通过虚拟化与资源池化实现算力资源的精细化管理与智能调度,推动AI技术走向“平民化”[1] - 该技术致力于解决企业有限算力卡在模型开发阶段需同时支持开发、训练与推理的问题,核心目标是让算力资源“活”起来[1] 行业痛点与解决方案 - 行业面临小任务单卡算力用不完的痛点,例如使用Llama3.0 3B模型进行文本总结时单卡算力利用率极低,RAG模型仅占用3%-5%算力[1] - 大任务单机算力不够用,需跨节点聚合资源,同时多任务并发调度存在资源争抢难题[1] - 针对资源切分,通过API劫持与转发将单张GPU或NPU切分为1/4、1/8、1/16等虚拟算力单元,实现空间共享与资源隔离,在测试中资源利用率从20%提升至80%,在NPU上实验显示资源利用率可达99%[1] - 针对跨节点聚合,研发跨节点拉远虚拟化技术,通过API劫持与RDMA高速网络将集群中各节点的空闲XPU算力聚合为共享算力池,该方案相比现有最优技术提升67%高优先级作业吞吐量,并有效利用17%的内部碎片资源[1] - 针对智能调度,研发Hi Scheduler调度器支持对国产GPU、NPU等异构算力进行时分与空分切分,通过分层调度机制使集群整体资源利用率提升30%,并保障多租户环境下的公平性与隔离性[1] 开源策略与生态建设 - 公司将Flex:ai全栈技术开源,开源模块包括智能调度器与算力虚拟化组件,支持与Kubernetes等主流框架集成,以加速技术普及与生态共建[2] - 开源方案面向异构硬件开放,相比受限于商业合作与硬件绑定的RunAI等方案更具通用性,未来将推动南向异构算力兼容并构建标准化接口[2] - 高校已布局拓扑感知调度、推理负载优化等后续研究方向,以推动该技术在复杂场景中落地[2] 底层技术挑战与进展 - 企业部署AI推理面临高服务质量与低资源利用率根本矛盾,例如医院白天推理服务器负载峰值而夜间闲置导致资源利用率极低[3] - 实现动态扩缩、任务迁移与细粒度资源分配需突破保序流图、细粒度资源隔离与安全点协议三大技术[3] - 通过算子劫持、状态同步与分层调度,在单卡场景下实现故障迁移与性能隔离,开销控制在5%以内,但跨节点迁移与大规模集群调度仍是待攻克难点[3]
算力迎来“量子跃迁”!计算机ETF(159998)昨日再获净申购超1500万份,云计算ETF天弘(517390)连续两日反弹
21世纪经济报道· 2025-11-26 01:32
市场表现 - A股市场震荡拉升,创业板指收涨近2%,AI应用和光通信等概念板块表现活跃 [1] - 计算机ETF(159998)连续两日反弹,昨日再获净申购1560万份,此前连续5个交易日资金净流入累计超6900万元 [1] - 云计算ETF天弘(517390)连续两日上涨,截至11月24日,该ETF年内份额增长率达380.36% [1] - 计算机ETF成分股中,石基信息涨超7%,卫宁健康涨超5%,千方科技、协创数据等跟涨 [1] 算力技术突破 - 上海交通大学发布全球首款量子科学计算平台UnitaryLab,旨在解决传统计算机在复杂科学计算中算力不足和耗时过长的瓶颈问题 [2] - 华为发布Flex:ai AI容器软件,通过算力切分技术将单张GPU/NPU算力卡切分粒度精准至10%,实现单卡同时承载多个AI工作负载,并可聚合集群内空闲算力形成共享算力池 [2] - 华为Flex:ai软件核心围绕XPU池化、算力细粒度切分和全局智能调度三大支柱,致力于提升AI集群算力利用效率、降低生态迁移门槛、加速模型训练与推理落地 [2] 行业前景与投资机会 - 中证计算机主题指数覆盖软件开发、计算机设备、IT服务行业,确定性较高的AI落地方向包括软硬结合的端侧AI硬件、C端出海软件、B端企业服务与制造业信息化、G端大模型私有化部署等 [1] - 中证沪港深云计算产业指数可一键网罗沪、港、深三地最具竞争力的云计算核心资产 [1] - 国产算力软件层强化统一调度能力,构成以软件能力补齐硬件短板的确定性突破 [2] - 英伟达业绩超预期且展望乐观,算力需求持续旺盛,持续看好AI应用及算力端投资机会 [2]
华为发布开源AI容器技术Flex:ai:让闲置算力“动起来”,把一张卡切给多任务使用丨最前线
36氪· 2025-11-25 13:54
文章核心观点 - 华为公司发布并开源AI容器技术Flex:ai,旨在通过三项技术创新解决“算力不够用”和“算力被浪费”并存的问题,提升算力资源利用率 [1] - 该技术通过对GPU、NPU等智能算力资源的精细化管理与智能调度,将零散算力统一成资源池,并智能分配不同规模的AI任务 [1] - 此次开源是华为与上海交通大学、西安交通大学、厦门大学产学合作的成果,旨在推动异构算力虚拟化与AI应用平台对接的标准构建 [1][2] 技术核心能力 - **XPU池化框架**:与上海交通大学联合研发,将单张GPU或NPU算力卡按10%的精度切分为多个虚拟算力单元,实现“用多少,切多少”,使小模型训练推理场景下的整体算力平均利用率提升30% [2] - **跨节点拉远虚拟化技术**:与厦门大学研发,可聚合集群内各节点的空闲XPU算力形成“共享算力池”,让不具备智能计算能力的通用服务器也能通过网络调用远端GPU/NPU资源参与AI计算 [2] - **Hi Scheduler智能调度器**:与西安交通大学共同推出,能感知集群里多品牌、多规格算力资源的状态,根据任务优先级、算力需求等参数自动选择资源,实现分时复用和全局最优调度 [2] 行业影响与目标 - 技术基于Kubernetes构建,通过对GPU、NPU等资源的精细化管理与智能调度,统一零散算力并智能分配AI任务 [1] - 全面开源将向产学研各界开发者开放所有核心技术能力,共同推动异构算力虚拟化与AI应用平台对接的标准构建,形成算力高效利用的标准化解决方案 [2]
创业板人工智能ETF南方(159382)上涨4.19%,国产算力再获重要突破,机构:AI引领的中国股票上涨远非泡沫
新浪财经· 2025-11-25 02:27
创业板人工智能ETF市场表现 - 截至2025年11月25日09:55,创业板人工智能ETF南方(159382)上涨4.19%,成交3083.35万元 [1] - 其跟踪的创业板人工智能指数强势上涨4.44%,成分股长芯博创上涨14.31%,光库科技上涨13.39%,易点天下上涨9.08% [1] - 截至11月24日,该ETF近5个交易日合计净流入资金4.96亿元 [1] 华为AI技术创新 - 华为于11月21日发布并开源创新AI容器技术Flex:ai,该技术基于Kubernetes构建,核心是XPU池化与调度软件 [1] - Flex:ai通过算力切分技术将单张GPU/NPU算力卡切分为多份虚拟算力单元,切分粒度精准至10% [1] - 在算力资源平均利用率仅为30%至40%的行业背景下,该技术可将算力资源平均利用率提升30% [1] - 该技术致力于大幅提升AI集群算力利用效率、降低生态迁移门槛、加速模型训练与推理落地进程 [2] 政策支持与行业前景 - 广东省人民政府印发建设方案,将人工智能与机器人产业创新发展列为重要方向,并开展双行动 [2] - 方案支持企业研发通用大模型、行业大模型及专用模型,并推动智能机器人与其他终端产品创新融合 [2] - 目标到2027年,全省人工智能核心产业规模超4400亿元 [2] - 有观点认为AI引领的中国股票上涨并非泡沫,中国科技公司仍有空间通过专注AI应用提升估值和盈利 [3] 指数与产品构成 - 创业板人工智能ETF南方(159382)紧密跟踪创业板人工智能指数 [3] - 创业板人工智能指数前十大权重股包括中际旭创、新易盛、天孚通信、协创数据、深信服等 [3]
华为联合三大高校发布并开源AI容器技术Flex:ai,助力破解算力资源利用难题
新浪科技· 2025-11-24 14:03
行业背景与核心问题 - AI产业高速发展催生海量算力需求,但全球算力资源利用率偏低问题日益凸显 [1] - 算力资源浪费成为产业发展关键桎梏,具体表现为小模型任务独占整卡导致资源闲置,大模型任务单机算力不足,大量缺乏GPU/NPU的通用服务器处于算力休眠状态 [1] 技术发布与合作 - 华为公司副总裁周跃峰在2025 AI容器应用落地与发展论坛上正式发布AI容器技术Flex:ai [1] - 华为联合上海交通大学、西安交通大学与厦门大学共同宣布将此项产学合作成果向外界开源 [1] 技术方案与核心突破 - 发布的Flex:ai XPU池化与调度软件基于Kubernetes容器编排平台构建,旨在通过对GPU、NPU等智能算力资源的精细化管理与智能调度,实现AI工作负载与算力资源的精准匹配 [1] - 华为与上海交通大学联合研发XPU池化框架,可将单张GPU或NPU算力卡切分为多份虚拟算力单元,使小模型训推场景下的整体算力平均利用率提升30% [2] - 华为与厦门大学联合研发跨节点拉远虚拟化技术,将集群内各节点的空闲XPU算力聚合形成共享算力池,促进通用算力与智能算力资源融合 [2] - 华为与西安交通大学共同打造Hi Scheduler智能调度器,实现AI工作负载分时复用资源,保障在负载频繁波动场景下AI工作负载的平稳运行 [2]
华为发布AI容器技术Flex:AI,国产算力再次突破
中邮证券· 2025-11-24 05:50
行业投资评级 - 行业投资评级为“强于大市”并维持此评级 [1] 核心观点 - 华为发布并开源创新AI容器技术Flex:ai,通过算力切分技术将单张GPU/NPU算力卡切分为多份虚拟算力单元,切分粒度精准至10%,旨在解决行业内算力资源平均利用率仅为30%至40%的难题 [4] - 在无法充分利用整卡算力的AI工作负载场景下,华为Flex:ai技术可使算力资源平均利用率提升30% [4] - Gartner预测,到2027年,75%以上的AI工作负载将采用容器技术进行部署和运行 [5] - 与英伟达Run:ai相比,华为Flex:ai在虚拟化、智能调度等方面具备独特优势,并秉持开源与兼容异构算力理念,可实现对英伟达、昇腾及其他第三方算力资源的统一管理和高效利用 [5] - 该技术是“以软件能力补齐硬件短板”的确定性突破,其核心围绕“XPU池化+算力细粒度切分+全局智能调度”三大支柱,致力于提升AI集群算力利用效率、降低生态迁移门槛、加速模型训练与推理落地进程 [6][7] 行业基本情况与表现 - 行业收盘点位为5068.36,52周最高点为5841.52,52周最低点为3963.29 [1] - 行业指数相对沪深300指数的表现数据涵盖从2024年11月至2025年11月,具体相对值变化区间为-13%至27% [3] 建议关注领域及公司 - 报告建议关注两大方向:AI容器技术领域与国产算力领域 [7] - AI容器领域建议关注公司包括:博睿数据、浩瀚深度、普元信息、青云科技、实达集团、首都在线、中亦科技、南威软件、浪潮数字企业 [7] - 国产算力领域建议关注公司包括:寒武纪、云天励飞、亿都(国际控股)、浪潮信息、曙光数创、超讯通信、瑞晟智能、华丰科技、神州数码、软通动力、烽火通信、广电运通、拓维信息、四川长虹、润建股份、数据港、润泽科技、光环新网、科华数据、奥飞数据、优刻得、立讯精密、安博通等 [7]
翼虎周观察 | 同频共振筑底时,结构牛途寻真章
搜狐财经· 2025-11-24 05:42
全球及中国市场表现 - 全周A股市场主要指数普遍下跌,上证指数下跌3.90%,深成指下跌5.13%,创业板指数下跌6.15% [1] - 市场资金进行高低切换,从有色、化工等涨价方向及拥挤的科技板块流出,切入银行、传媒、食品饮料、国防军工、家用电器等防守板块 [1] - H股方面,恒生科技和恒生医疗继续调整,恒生科技进入技术性熊市 [1] - 美股三大指数继续调整,资金从科技板块流向医疗保健等防御性板块,纳斯达克指数周跌2.74% [10] - 市场成交量维持日均2万亿左右,经过两周剧烈调整后预计将进入筑底阶段 [1] 医药生物板块 - 医药行业指数全周下跌6.88%,各细分领域普遍下跌,化学制药下跌7.02%,生物制品下跌7.46%,医疗器械下跌6.38%,医药商业下跌7.67%,中药下跌6.46%,医疗服务下跌6.90% [5] - 礼来公司股价突破1061.17美元,市值首次触及1万亿美元,成为全球首家万亿市值医疗保健公司,其GLP-1类减肥药贡献55%营收 [7] - 百济神州三季度百悦泽全球收入10亿美元,同比增长51%;诺诚健华奥布替尼前三季度收入10.1亿元,同比增长45.8% [8] - 基蛋生物前三季度海外自产常规产品收入1.24亿元,同比增长46.21%,其中三季度单季收入0.51亿元,同比增长47.34% [7] - Moderna终止3个临床阶段mRNA项目,同时获得15亿美元五年期贷款,未来战略将聚焦肿瘤与罕见病领域 [7] 科技与互联网板块 - A股科技板块跟随美股回调,软件开发下跌2.62%,IT服务下跌1.14%,半导体下跌6.09%,光伏设备下跌12.26% [15] - 港股科技板块遭遇显著调整,恒生科技指数全周下跌7.18%,成分股中新能源汽车、半导体及AI相关个股跌幅居前 [10] - 英伟达Q3季度营收570亿美元,超出一致预期,数据中心营收512亿美元,同比增长66%,环比增长25%,下一季度营收指引中值为650亿美元 [17] - 谷歌发布Gemini 3模型,官方称其在多模态理解测评中得分超越GPT-5达12个百分点,并推出支持4K图像生成的Nano Banana Pro功能 [12] - 阿里巴巴AI应用“千问APP”上线次日冲入苹果App Store免费应用总榜第四位;蚂蚁集团“灵光App”上线4天下载量突破100万 [13] 投资策略与市场观点 - 翼虎投资下半场策略围绕“科技变革”和“逆全球化”两大宏观叙事,主抓“AI+创新药”及地缘政治博弈下的军工与稳定币机会 [3] - 市场观点认为A股当前处于二浪调整行情最激烈的过程,可能加速见底,筹码完成交换后,市场或在明年1月份迎来三浪主升浪,主线依然是科技板块 [16] - 量化选股策略在经历8月至9月的负超额后,自9月19日至11月7日期间表现回升,量化选股私募指数涨幅3.41%,跑赢中证500和中证2000指数 [21] - 股指期货方面,本周为2511主力合约交割周,各品种基差转为升水,IH、IF、IC、IM2510合约基差分别为14.75、27.59、56.99、62.50,显示下周反弹概率较大 [21] 行业创新与研发进展 - 免疫方舟的IMB071703注射液启动I期临床,用于治疗晚期实体瘤,目标入组90人 [8] - 泰力生物的NF2105胶囊开启Ⅰ期临床试验,适应症为慢性髓性白血病,目标入组48人 [8] - Moderna与默沙东合作的癌症疫苗mRNA-4157已进入后期临床试验,适应症涵盖黑色素瘤、非小细胞肺癌等 [9] - 华为联合三所高校发布并开源AI容器技术Flex:ai,旨在提升算力利用效率 [14]
破解算力资源利用难题,华为联合三大高校发布并开源AI容器技术
观察者网· 2025-11-24 02:05
行业背景与问题 - AI产业高速发展催生海量算力需求,但全球算力资源利用率偏低问题日益凸显 [1] - 算力资源浪费表现为小模型任务独占整卡导致资源闲置,大模型任务单机算力不足,大量缺乏GPU/NPU的通用服务器算力处于休眠状态 [1] 技术解决方案概述 - 公司发布并开源AI容器技术Flex:ai,其核心是XPU池化与调度软件,基于Kubernetes容器编排平台构建 [3] - 该技术通过对GPU、NPU等智能算力资源的精细化管理与智能调度,实现AI工作负载与算力资源的精准匹配,旨在提升算力利用率 [3] - 技术是与上海交通大学、西安交通大学、厦门大学共同研发的产学合作成果 [1][3] 核心技术突破一:XPU池化框架 - 针对小模型训推场景资源浪费问题,与上海交通大学联合研发XPU池化框架 [4] - 可将单张GPU或NPU算力卡切分为多份虚拟算力单元,切分粒度精准至10%,实现单卡同时承载多个AI工作负载 [4] - 通过弹性资源隔离技术实现算力单元按需切分,使此类场景整体算力平均利用率提升30% [4] 核心技术突破二:跨节点拉远虚拟化 - 针对通用服务器缺乏智能计算单元问题,与厦门大学联合研发跨节点拉远虚拟化技术 [4] - 将集群内各节点空闲XPU算力聚合形成共享算力池,为高算力需求工作负载提供支撑 [4] - 允许通用服务器通过高速网络将AI工作负载转发到远端资源池中的GPU/NPU算力卡执行,促进通用算力与智能算力资源融合 [4] 核心技术突破三:智能调度器 - 针对多品牌、多规格异构算力资源统一调度痛点,与西安交通大学共同打造Hi Scheduler智能调度器 [5] - 调度器可自动感知集群负载与资源状态,结合AI工作负载优先级、算力需求等多维参数,对本地及远端虚拟化资源进行全局最优调度 [5] - 实现AI工作负载分时复用资源,在负载频繁波动场景下保障工作负载平稳运行 [5]