Unitree Z1

搜索文档
宇树:开源机器人世界大模型!
量子位· 2025-09-16 04:05
核心观点 - 宇树科技开源世界模型-动作架构UnifoLM-WMA-0 专为通用机器人学习设计 能够理解机器人与环境交互的物理规律 并支持多机器人本体适配 [1][9] 技术表现 - 模型在真机部署中表现稳定 包括堆积木任务 预测视频与实际操作高度吻合 [2][3] - 支持双机械臂协作任务及精细操作如文具收纳 [5][7] - 作为仿真引擎使用时 可根据当前场景图像和未来动作指令生成可控交互内容 精准匹配预期效果 [23] 模型架构与训练 - 架构支持两种模式:决策模式(预测物理交互关键信息辅助动作生成)和仿真模式(生成逼真环境反馈模拟交互) [19][20] - 训练基于Open-X数据集微调视频生成模型 适配机器人实际作业场景 [15] - 使用宇树科技五个开源数据集完成全流程训练 包括Z1和G1机器人系列任务数据 [22][23] 开源与社区反响 - 完整开源训练代码、推理代码及模型Checkpoints GitHub迅速获得101个Star和11个Fork [11][12] - 项目提供详细训练策略及测试结果对比 包括长程任务交互生成能力验证 [12][23]
宇树开源了UnifoLM-WMA-0: 一个跨实体的世界模型+Action的框架
具身智能之心· 2025-09-16 03:29
核心观点 - 宇树科技推出开源世界模型-行动架构UnifoLM-WMA-0 专为通用机器人学习设计 具备物理交互理解能力 支持仿真引擎和策略增强两大功能 [2] 架构设计 - 架构嵌入世界模型 支持决策模式和模拟模式运行 决策模式预测未来物理交互信息辅助策略生成动作 模拟模式根据机器人动作生成高保真环境反馈 [7] - 基于视频生成模型微调 以图像和文本指令为输入 生成未来交互过程视频 适配机器人操作场景 [11] - 动作可控生成功能通过五个开源数据集训练 可根据当前图像和未来机器人动作实现交互式可控生成 [11] 数据集与模型 - 提供两个模型版本 UnifoLM-WMA-0Ba基于Open-X数据集微调 UnifoLM-WMA-0基于五个宇树机器人开源数据集训练 支持决策和模拟模式 [13] - 数据集覆盖Z1和G1机器人形态 包含双臂堆叠箱体 清理铅笔 包装相机等具体任务场景 [14] - 所有数据集和模型均通过HuggingFace平台开源提供 [13][14] 技术实现 - 训练过程分两阶段 先在Open-X数据集微调视频生成模型 再基于宇树机器人数据集训练动作可控生成能力 [11] - 测试表明模型可作为仿真引擎 实现基于图像和动作指令的交互式可控生成 [11]