KOM2.0模型

搜索文档
擎朗智能:发布全球首个针对服务行业的VLA模型KOM2.0
中证网· 2025-09-26 01:48
擎朗智能表示,KOM模型的发布,不仅是技术架构的升级,更是对机器人在真实场景中"所见即所知, 所知即所行"能力的重要推进。未来,公司将继续打造"通用+专用"多形态具身服务机器人矩阵,持续迭 代多模态大模型能力,与全球合作伙伴共同推动具身智能技术的规模化落地。 中证报中证网讯(记者乔翔)随着今年具身人形XMAN系列的发布,擎朗智能日前正式升级并发布全球首 个针对服务行业的VLA模型—KOM2.0。 据介绍,为了模仿人类的大小脑架构来实现效率最优,擎朗KOM2.0模型采用了"快-慢双系统"架构。其 中,"慢系统K-Mind"是多模态的视觉语言模型,负责高层任务理解与规划。它通过对周围环境的感知 和对自然语言的解析,结合多模型推理实现对复杂任务的规划与决策。"快系统K-Act"是动作专家模 型,负责生成具体的执行动作。它基于"K-Mind"的中间输出,结合机器人当前状态生成连续动作序 列。"快-慢双系统"可以异步协同运行,实现高层任务规划的可靠性和低层运动执行的高效性。 ...