MoMA多模型与智能体聚合及服务引擎

搜索文档

量子位· 2025-08-02 08:33

文章核心观点 - 中国移动发布MoMA多模型与智能体聚合及服务引擎，旨在通过汇聚业界优质模型与智能体，形成超级大模型能力服务基座，解决复杂任务并提供高效解决方案 [1] - MoMA引擎通过多级路由技术、动态编排和最优调用能力，解决了模型选择、意图理解和成本收益平衡等挑战 [3][4][5] - MoMA采用PD²-Matrix框架和分层路由机制，实现模型能力的精准诊断和任务的高效分发，提升效果与成本的动态平衡 [10][12][14] - MoMA已聚合15+个高质量内外部模型和20多个专家智能体，覆盖多个专业领域，并在百万级用户场景中提升42%的速度 [20][21] - 中国移动计划通过MoMA构建百模互联、千智协同的产业生态，推动人工智能产业进入新阶段 [22] 当前主要的问题与挑战 - 国内外已发布多款模型，但企业在应用时面临模型选择、意图理解和成本收益平衡等挑战 [3][5] - 模型路由选择和能力规划调度是基础问题，MoMA通过多级路由技术提供解决方案 [3] MoMA是什么 - MoMA是多模型与智能体聚合及服务引擎，通过标准化接口汇聚优质大模型与智能体，提供自动感知、动态编排与最优调用能力 [4] - MoMA形成持续进化的超级大模型服务基座，提供高准确率、高安全、高可靠、高效能的推理服务 [4] MoMA模型 - MoMA通过模型能力探测和智能体评估，自动选择最佳方案，并构建闭环监控反馈机制以适应数据变化和业务需求 [7][8] - 采用PD²-Matrix框架，将大语言模型能力结构化，实现从笼统评估到精准诊断的跨越 [10] MoMA工程引擎 - 以分层路由与动态编排为核心，形成超级大模型能力基座，实现效果、成本、效率三重约束下的最优决策 [12] - 多级路由机制分层次完成复杂任务的拆解与实现，并通过Monitor Model优化路由质量 [14] 复杂任务去中心化 - 采用Planner-Executor-Summarizer架构，动态采用混合模式实现任务自动拆解、编排与并行调用 [17] - 通过复杂任务路由技术提升响应时间，优化用户体验并降低输出幻觉 [17] MoMA协议体系 - 兼容MCP和A2A协议，拓展统一认证和安全通信能力，构建开放、安全、可信、高效的智能体技术体系 [19] MoMA应用 - 聚合15+个高质量内外部模型和20多个专家智能体，覆盖编程、数学、翻译、医疗等多个领域 [20] - 在百万级用户场景中，动态路由机制提升42%的速度，已应用于中国移动灵犀智能体2.0 [21] 商业化落地愿景 - 中国移动计划通过MoMA构建百模互联、千智协同的产业生态，推动人工智能产业进入新阶段 [22] - 发布《MoMA白皮书（2025）》，介绍目标愿景、关键技术特征和典型应用场景 [22] 技术活动 - 九天人工智能研究院将于8月6日开展技术直播，解析九天基础大模型、开源模型及数据集 [24]

Artificial Intelligence

Telecommunications

MoMA多模型与智能体聚合及服务引擎

Artificial Intelligence

Telecommunications

MoMA多模型与智能体聚合及服务引擎