Workflow
特斯拉或改变Optimus的训练策略,加入视频学习

技术路线转变 - 特斯拉改变擎天柱人形机器人训练策略 从依赖动作捕捉和遥控操作转向主要依靠视频训练 [1] - 人工智能主管阿肖克·埃卢斯瓦米接任项目负责人 体现公司对机器视觉加人工智能路线的坚持 [1] - 新方法通过录制工人执行任务视频教导机器人快速执行拾取物体或折叠T恤等操作 [1] 训练方法对比 - 远程操作和动作捕捉是行业训练机器人的标准做法 例如波士顿动力采用类似方法训练Atlas机器人 [3] - 特斯拉内部曾使用动作捕捉服和VR设备记录人类操作数据并远程控制机器人 [1][5] - 工作人员需长时间穿着动作捕捉服执行简单任务 数据由注释者分析后用于训练人工智能系统 [4][5] 数据收集挑战 - 动作捕捉服和机器人故障问题限制数据收集量 工厂训练可能需要数十万到数百万小时数据 [8] - 数据收集成本可能达五亿美元且成功与否存在不确定性 [8] - 截至8月底特斯拉招聘页面列出50多个Optimus相关职位 但排除动作捕捉数据收集员岗位 [4] 视频训练优势 - 视频训练方法使团队能更快扩大数据收集规模 [1] - 五月份展示的机器人已能从人类视频直接学习新任务 [3] - 摄像头多角度采集能捕捉关节手指位置等细节 帮助AI模型精确适应环境 [8] 技术可行性分析 - 马斯克承认人形机器人训练需求至少是汽车训练需求的10倍 [9] - 视频训练方法与特斯拉自动驾驶软件训练流程一致 主要依靠机器视觉从数百万车主数据中学习 [10] - 专家指出单纯视频训练难以弥补虚拟与现实鸿沟 混合数据策略可能是更可行的长期方案 [12] 行业发展动态 - 行业存在多种技术路线分歧 特斯拉采用纯视频训练而其他公司坚持混合数据策略 [12] - 谢菲尔德大学专家认为特斯拉可能在寻找通用训练方法以适应各种任务 [9] - 公司可能采用与Physical Intelligence类似策略 通过大量演示数据让机器人学习可转移技能 [9]