2026AI原生基础设施实践指南
中国移动·2025-12-28 06:16

报告行业投资评级 * 报告未明确给出具体的行业投资评级 [10][11][12] 报告核心观点 * 人工智能技术正以前所未有的深度和广度渗透各行各业,驱动经济社会发展模式发生根本性变革 [8] * AI原生基础设施是数智化时代新质生产力的关键技术底座,其设计核心理念是规模化支撑AI原生应用,全栈适配AI特性,从根本上重塑价值获取、创造和交付方式 [8][36] * 新型基础设施适度超前建设的政策导向和“人工智能+”行动的持续推进使得产业对AI原生基础设施需求空前高涨 [9] * AI规模化落地对企业IT基础设施提出了“既要大、又要快、还得省”的刚性需求,原有IT基础设施的转型升级刻不容缓 [24] * AI原生基础设施建设的总体目标是构筑面向智能应用的一体化开发、运行、支撑的软件平台,打通“算力调度—模型开发—智能体部署”全链路 [38] 行业兴起的时代背景 * 政策牵引力:自2017年《新一代人工智能发展规划》发布以来,AI重要性已上升至国家战略层面,2025年《关于深入实施“人工智能+”行动的意见》提出发展智能原生技术、产品和服务体系,标志着AI的战略定位从“赋能工具”向“基础设施”转变 [18][19][22] * 产业驱动力:2024年全球人工智能IT总投资规模为3158亿美元,并有望在2028年增至8159亿美元,2024年中国人工智能产业规模已超9000亿元,同比增长24% [23] * 技术创新力: * 算力:智算集群正从万卡级规模向十万卡级迈进,液冷普及率超80%,业界正加速发展算力网络以实现对广域分布式、跨技术架构算力资源的统一标识、感知与智能调度 [25][26] * 数据:数据技术正经历从“以存储为中心”转向“以语义智能为中心”、从“依赖真实采集”转向“按需制造”、从“静态交付”转向“动态闭环供给”三大范式跃迁 [27] * 模型:大小模型产业共生,开源生态(如DeepSeek、Qwen)与闭源模型协同发展,模型技术创新在追求规模扩张的同时也注重效率与实用性的提升 [28] * 应用:智能体已成为AI应用的主流形态,技术正从单智能体任务执行迈向多智能体的高质量协同,支撑智能体规模化发展的基础设施正逐步演进为“AI原生操作系统” [29] AI原生基础设施发展脉络与架构 * 发展历程:概念发展可分为萌芽期(1950-2009年)、探索期(2010-2022年)和发展期(2023年至今)三个阶段,伴随生成式大模型及相关应用的爆发式增长,全栈适配AI特性的基础设施已成为产业可预见的演进趋势 [31][32][34] * 定义:AI原生基础设施是从设计阶段即将规模化支撑AI原生应用作为核心理念,全栈适配AI特性的基础设施体系,通过软硬件、网络、数据、算法等要素的深度协同,为AI原生应用提供全生命周期的能力支持 [35][36] * 总体架构:涵盖通智算基础资源、通智算调度引擎、沙箱、模型研发生产、数据供给、向量数据库、智能体引擎、AI网关、AI原生应用开发管理、AI原生运维、AI安全保障、数字可信等十二个关键要素 [38][39] AI原生基础设施建设思路 * 通智算基础资源:包括以GPU、NPU等异构加速卡为核心的智算资源池和由x86/ARM服务器组成的通算资源池,需实现两者的融合调度与统一管理 [45] * 通智算调度引擎:作为PaaS层技术底座,承担容器层异构算力资源调度,连接底层基础设施与上层应用的作用,需提供统一的动态调度分配能力 [46][49] * 沙箱:是智能体运行时的关键组件,通过构建受限制、可监控的虚拟执行环境,使智能体能够安全、可靠地调用外部工具,可分为浏览器、代码、桌面、手机四个场景 [51][55] * 模型研发生产:提供覆盖模型微调、部署、评测、引擎服务、推理加速、多模型协同管理的工具链,旨在解决模型研发周期长、推理性能不足、工具碎片化、协同管理难等痛点 [58][59] * 数据供给:是一个集数据汇聚、存储、处理、标注、合成、质量评测、管理、共享及跨模态检索等能力于一体的综合性数据基础设施,旨在构建全流程的高效数据供给体系 [60][64] * 向量数据库:是AI原生应用的重要数据组件,承担高维向量的高效存储、检索与管理能力,需注重融合架构(与关系型数据库深度融合)和开发者友好 [65][71] * 智能体引擎:是AI原生基础设施中的核心上层建筑,定位是打造企业级智能体操作系统,其架构自下而上分为Agent OS内核层、智能体开发套件层和AI原生应用生态 [73][75] * AI网关:是AI原生基础设施构建的核心要件,在最终用户、AI应用和模型之间发挥枢纽作用,核心功能包括API路由、模型代理、智能体枢纽、MCP调度、AI流量分析等 [83][86] * AI原生应用开发管理:将AI能力深度嵌入项目管理的需求、设计、开发、测试、部署全过程,从辅助研发升级为AI自主化操作,以提升研发效能 [89][94] * AI原生运维:是面向AI原生的全栈可观测运维体系,涵盖全栈可观测、AI评估、告警治理、资源中心、指标采集等核心能力,旨在保障生产环境中模型的可靠运行 [95][98] * AI安全保障:是确保AI行为可控、输出合规、运行可信的核心保障体系,涵盖应用层、模型层、数据层和系统层的防护,关键指标包括攻击识别准确率超过99.5%、审核延迟小于200ms等 [100][102] * 数字可信:需在“算力—数据—模型—应用”全生命周期系统化融入可信能力,构建覆盖可信算力协同、可信数据供给、可信模型训推、可信应用治理并以可信测评体系贯穿支撑的总体架构 [103][109] 行业实践案例(通信行业) * 中国移动AI原生基础设施实践:集团数智化部牵头建设创新AI原生基础设施,旨在实现可靠算力与数据资源供给、优化AI开发及运行全生命周期效率、强化AI运营运维和安全合规治理三大目标 [111] * 中国移动聚智智能体平台:基于AI原生基础设施能力,构建了以Agent OS为核心的一体化智能体解决方案,其核心能力超级智能体引擎曾登顶GAIA全球榜单,截至2025年12月,平台已服务超90%的省专单位,研发智能体数千个,平台累计调用量超百万次 [112][113][114][116] * 中国移动某省灵犀助手实践:是基于Agentic AI架构为客户经理打造的智能化工作伙伴,覆盖工作全流程,使用后查询效率提升3倍,单业务办理耗时效率提升60%,用户规模达数万人,每月调用量超过上百万次 [117][119] * 中国移动某省大模型网关实践:旨在解决大模型应用过程中“适配烦、选择难、安全不可控、响应时间长”等问题,通过建设统一、安全、高效的大模型服务中枢,支撑通信行业及政企客户智能化升级 [121]