公司动态 | 40万下载量!星海图真机数据集登顶全球主流开源平台
具身智能之心·2025-10-29 00:03

数据集发布与市场反响 - 星海图开放世界数据集于2025年8月开源,在两个月内下载量突破40万次,成为全球最受关注、下载量最高的具身智能真机数据集之一 [1] - 数据集获得Physical Intelligence、Bitrobot、Hugging Face等国际前沿团队的公开推荐,被视为极具价值的社区资源 [1] - 全球机器人研究者、实验室与应用企业正基于该数据集进行系统验证和模型训练 [1] 数据集核心价值与行业痛点 - 数据集旨在破解行业依赖互联网数据(质量不均)和仿真数据(难以真实还原物理交互)的困境,直面真实世界的复杂性 [3] - 数据集为全球开发者提供了可直接使用的高质量数据资源,满足其对真实世界数据的迫切需求 [6] - 通过开源真实世界数据,旨在推动具身智能模型在现实环境中的能力验证,加速技术从实验室迈向产业化 [5] 数据集内容与特征 - 数据在50多个真实场景中采集,覆盖住宅、餐饮、零售、办公室等现实人机交互主要形态 [7] - 数据集规模超过10TB,累计时长500小时,包含10万条以上真实操作数据 [7] - 数据涵盖150类任务类型、1600+操作对象与58项操作技能,并提供多模态传感信息与自然语言标注 [7] - 数据集提供细粒度的子任务级注释,实现精确的多模态对齐,并经过严格质检以剔除无效数据,确保可信度 [7] 数据采集的技术与工程支撑 - 采集硬件以自研机器人R1 Lite为主,具备23自由度,支持从精细抓取到全身协调的复杂操作 [8] - 高精度传感器系统保证了动作数据的高保真,球形腕关节与并联抓手确保对多种物体的操控能力 [8] - 工程化体系包含一套智能化数据管线,实现从采集、质检、标注到审核的全流程管理,确保数据质量 [10] - 专业化采集工艺确保机器人在不同场景下动作标准化,减少人为与环境偏差 [10]