智元机器人发布行业首个机器人世界模型开源平台 实测可完成做三明治、倒茶等任务
产品发布 - 智元机器人发布行业首个机器人世界模型开源平台Genie Envisioner(GE)[1] - 平台突破传统"数据—训练—评估"割裂流水线模式 整合未来帧预测、策略学习与仿真评估进以视频生成为核心的闭环架构[1] - 建立从语言指令到视觉空间的直接映射 完整保留机器人与环境交互时空信息[1] 技术架构 - GE平台核心组件包括GE-Base经超100万条数据训练 可精准解析环境空间布局与动作意图[1] - GE-Act动作解码器实现从"看懂"到"会做"的关键转化[1] - GE-Sim将生成能力扩展为动作条件的神经仿真器 通过层次化动作条件机制实现精确视觉预测[1] 数据支撑 - 平台依托约3000小时真实机器人操控视频数据训练[1] - GE-Base组件经海量机器人真机数据训练 具备长程多视角视频生成能力[2] - 采用飞机架构比喻:"机身"为GE-Base "双翼"分别对应World Action Model和Action-conditioned World Model[2] 应用验证 - 搭载GE-Act的机器人已能完成"做三明治""倒茶""擦桌面"等多项任务[3] - 平台使机器人能在同一世界模型中完成从"看"到"想"再到"动"的端到端推理与执行[1]