宇树:开源机器人世界大模型!
量子位·2025-09-16 04:05
核心观点 - 宇树科技开源世界模型-动作架构UnifoLM-WMA-0 专为通用机器人学习设计 能够理解机器人与环境交互的物理规律 并支持多机器人本体适配 [1][9] 技术表现 - 模型在真机部署中表现稳定 包括堆积木任务 预测视频与实际操作高度吻合 [2][3] - 支持双机械臂协作任务及精细操作如文具收纳 [5][7] - 作为仿真引擎使用时 可根据当前场景图像和未来动作指令生成可控交互内容 精准匹配预期效果 [23] 模型架构与训练 - 架构支持两种模式:决策模式(预测物理交互关键信息辅助动作生成)和仿真模式(生成逼真环境反馈模拟交互) [19][20] - 训练基于Open-X数据集微调视频生成模型 适配机器人实际作业场景 [15] - 使用宇树科技五个开源数据集完成全流程训练 包括Z1和G1机器人系列任务数据 [22][23] 开源与社区反响 - 完整开源训练代码、推理代码及模型Checkpoints GitHub迅速获得101个Star和11个Fork [11][12] - 项目提供详细训练策略及测试结果对比 包括长程任务交互生成能力验证 [12][23]