深扒了具身的数据路线,四小龙的格局已经形成......
具身智能之心·2025-12-24 10:04

文章核心观点 - 具身智能行业正围绕数据采集、模型训练、数据扩展和模型优化的闭环链路发展,数据是当前发展的主线[1] - 行业并非寻求单一最优解,而是在不同阶段和约束下,沿着四条数据路线同时前进[3] - 这四条路线已形成四种具身数据供给范式,并初步形成了以智元、银河、它石、鹿明为首的“具身数据四小龙”格局[4][34] - 2026年行业竞争将加剧,但掌握数据话语权的公司前景看好[5] - 具身智能正从探索阶段走向长期能力迭代,数据体系的重要性从“支撑算法”转变为“决定节奏”[43] 四条核心数据路线及其特点 - 遥控真机数据:最真实、最昂贵,数据价值密度极高,是研究者的“安全感来源”,但存在慢、贵、强绑定本体、规模扩张成本线性增长等问题,被视为高质量样本但难以大规模供给[6][8][9][10][12][13][14] - 仿真合成数据:效率高、规模几乎无限,通过技术提升“像真度”,但始终存在与现实世界的“领域鸿沟”,在精细操作和复杂交互中问题会被放大,是很好的“训练场”但难决定真实世界上限[6][16][17][18][19][20][21] - 人类视频数据:最便宜、数据量巨大、获取成本极低、场景覆盖极广,但易被误解,存在人体与机器人结构不一致、缺少力觉触觉反馈、动作可执行性无保证、标注对齐成本高等问题,通常作为真实交互数据丰富后的“叠加项”而非起点[6][22][23][25] - UMI数据:无本体依赖,更通用的数据协议,重新定义了数据与机器人本体的关系,将真实交互数据从特定机器人解耦,实现了真实世界交互、多本体适配、多机并行采集、工业级质量控制及可长期规模部署,让真实数据首次具备持续供给的可能性,正成为重要的具身数据基础设施[6][27][28][30][31] 各路线代表公司及实践 - 遥控真机路线:海外以特斯拉为代表,国内以智元机器人为代表,其开源了百万真机数据集AgiBot World,并支撑了GO-1具身基座大模型和全人形WholeBodyVLA方案[35][39] - 仿真数据路线:国内以银河通用为代表,基于十亿量级仿真数据发布了全球首个全仿真预训练具身大模型GraspVLA及灵巧手抓取数据集DexonomySim[35][39] - 人类视频路线:海外有Figure AI,国内以它石智航为代表,发布了包含10万+真实人类操作视频的WIYH数据集及配套的SenseHub数据采集系统[35][39] - UMI路线:海外有Generalist用27万小时真机数据训练Gen0模型验证价值,国内鹿明机器人是产业界最早探索该路线的代表,发布了FastUMI Pro系统,使采集效率提升3倍,成本降至传统方案的1/5[35][39] 各数据路线的角色与行业意义 - 遥控真机数据用于验证能力上限[40] - 仿真数据用于放大探索空间[40] - 人类视频数据用于扩展语义覆盖[40] - UMI数据用于支撑真实世界的长期数据供给[40] - 四条路线并非互相否定,而是各自承担不同角色,共同构成行业的数据供给结构[38] - UMI路线对团队早期选择与持续投入依赖更强,其积累是路线选择和长期投入的结果[41][42] - “具身数据四小龙”是当前阶段性结构分工的描述,未来优势将取决于哪些团队能在真实世界中持续运行并累积数据[44][45]