智元机器人发布行业首个机器人世界模型开源平台实测可完成做三明治、倒茶等任务

产品发布 - 智元机器人发布行业首个机器人世界模型开源平台Genie Envisioner（GE）[1] - 平台突破传统"数据—训练—评估"割裂流水线模式整合未来帧预测、策略学习与仿真评估进以视频生成为核心的闭环架构[1] - 建立从语言指令到视觉空间的直接映射完整保留机器人与环境交互时空信息[1] 技术架构 - GE平台核心组件包括GE-Base经超100万条数据训练可精准解析环境空间布局与动作意图[1] - GE-Act动作解码器实现从"看懂"到"会做"的关键转化[1] - GE-Sim将生成能力扩展为动作条件的神经仿真器通过层次化动作条件机制实现精确视觉预测[1] 数据支撑 - 平台依托约3000小时真实机器人操控视频数据训练[1] - GE-Base组件经海量机器人真机数据训练具备长程多视角视频生成能力[2] - 采用飞机架构比喻："机身"为GE-Base "双翼"分别对应World Action Model和Action-conditioned World Model[2] 应用验证 - 搭载GE-Act的机器人已能完成"做三明治""倒茶""擦桌面"等多项任务[3] - 平台使机器人能在同一世界模型中完成从"看"到"想"再到"动"的端到端推理与执行[1]