Workflow
MoMA多模型与智能体聚合及服务引擎
icon
搜索文档
央企出手,让选大模型更容易了!中国移动发布MoMA聚合服务引擎
量子位· 2025-08-02 08:33
文章核心观点 - 中国移动发布MoMA多模型与智能体聚合及服务引擎,旨在通过汇聚业界优质模型与智能体,形成超级大模型能力服务基座,解决复杂任务并提供高效解决方案 [1] - MoMA引擎通过多级路由技术、动态编排和最优调用能力,解决了模型选择、意图理解和成本收益平衡等挑战 [3][4][5] - MoMA采用PD²-Matrix框架和分层路由机制,实现模型能力的精准诊断和任务的高效分发,提升效果与成本的动态平衡 [10][12][14] - MoMA已聚合15+个高质量内外部模型和20多个专家智能体,覆盖多个专业领域,并在百万级用户场景中提升42%的速度 [20][21] - 中国移动计划通过MoMA构建百模互联、千智协同的产业生态,推动人工智能产业进入新阶段 [22] 当前主要的问题与挑战 - 国内外已发布多款模型,但企业在应用时面临模型选择、意图理解和成本收益平衡等挑战 [3][5] - 模型路由选择和能力规划调度是基础问题,MoMA通过多级路由技术提供解决方案 [3] MoMA是什么 - MoMA是多模型与智能体聚合及服务引擎,通过标准化接口汇聚优质大模型与智能体,提供自动感知、动态编排与最优调用能力 [4] - MoMA形成持续进化的超级大模型服务基座,提供高准确率、高安全、高可靠、高效能的推理服务 [4] MoMA模型 - MoMA通过模型能力探测和智能体评估,自动选择最佳方案,并构建闭环监控反馈机制以适应数据变化和业务需求 [7][8] - 采用PD²-Matrix框架,将大语言模型能力结构化,实现从笼统评估到精准诊断的跨越 [10] MoMA工程引擎 - 以分层路由与动态编排为核心,形成超级大模型能力基座,实现效果、成本、效率三重约束下的最优决策 [12] - 多级路由机制分层次完成复杂任务的拆解与实现,并通过Monitor Model优化路由质量 [14] 复杂任务去中心化 - 采用Planner-Executor-Summarizer架构,动态采用混合模式实现任务自动拆解、编排与并行调用 [17] - 通过复杂任务路由技术提升响应时间,优化用户体验并降低输出幻觉 [17] MoMA协议体系 - 兼容MCP和A2A协议,拓展统一认证和安全通信能力,构建开放、安全、可信、高效的智能体技术体系 [19] MoMA应用 - 聚合15+个高质量内外部模型和20多个专家智能体,覆盖编程、数学、翻译、医疗等多个领域 [20] - 在百万级用户场景中,动态路由机制提升42%的速度,已应用于中国移动灵犀智能体2.0 [21] 商业化落地愿景 - 中国移动计划通过MoMA构建百模互联、千智协同的产业生态,推动人工智能产业进入新阶段 [22] - 发布《MoMA白皮书(2025)》,介绍目标愿景、关键技术特征和典型应用场景 [22] 技术活动 - 九天人工智能研究院将于8月6日开展技术直播,解析九天基础大模型、开源模型及数据集 [24]