Workflow
它石WIYH数据集
icon
搜索文档
具身智能迎来数据革命!它石智航发布WIYH数据集,比特斯拉Optimus领先半年
具身智能之心· 2025-10-11 10:00
行业核心问题与解决方案 - 主流大模型预训练依赖的互联网数据和仿真数据存在质量参差不齐、缺少动作信息、真实性有限及场景泛化难等不足,导致模型难以丝滑迁移到现实世界 [1] - 对人形机器人而言,实现“具身智能”的最大难关并非算法,而是如何获得规模化、真实、可泛化的高质量训练数据,这已成为行业公认的“卡脖子”难题 [1] - 公司发布的全球首个大规模真实世界具身VLTA多模态数据集World In Your Hands,旨在解决上述数据短缺与质量问题,标志着以人为中心的具身数据引擎新范式正式确立 [1] WIYH数据集的核心特征 - 数据集具备四大核心特征:真实(采集源于真实具身任务)、丰富(横跨多个行业与操作技能)、全面(囊括视觉、语言、触觉、动作多模态全真值)及海量(量级上限堪比大语言模型) [3] - 数据采集覆盖酒店洗衣、超市装配、物流作业等多种真实工作场景的人类标准操作流程,解决了“数据量少、质量低、成本高”的问题 [3] - 通过深入真实生活操作场景采集数据,对比业内高成本自建数采工厂,显著提升了数据的真实性、多样性和泛化能力,同时降低数采成本一个数量级以上 [4] WIYH数据集的独特优势 - 在模态完整性上,通过自研采集套件同步获取视觉、力触觉和动作数据,确保多源数据在时间和空间上的精准对齐 [4] - 在数据标注链路上,依托云端基础大模型完成高精度标注,覆盖2D语义、场景深度、操作任务分解等多粒度真值标签,为模型预训练提供全面多维的监督信号 [4] - 该数据集是行业首次将视觉、语言、触觉与动作多模态数据在真实世界大规模跨行业跨任务采集,为未来实现具身基座模型的规模定律奠定了基础 [1] 行业影响与未来展望 - WIYH数据集的发布标志着以人为中心的具身数据新范式确立,让面向真实世界的具身AI World Engine预训练成为可能 [6] - 数据集立足“千行百业”,有望实现“一模千任”,成为通用具身基座模型训练的关键语料和基础设施,推动行业应用从单一任务迈向具备通用操作能力的新阶段 [6] - 公司计划于2025年12月面向行业共享开放该数据集,致力于为行业提供最优质的本体、数据和模型解决方案,以推动开放繁荣的具身智能生态 [6]