具身智能数据采集布局 - 北京多家企业与机构布局数据采集中心 包括智源研究院 银河通用 北京人形机器人创新中心 星海图与千寻智能等 规模从三四十人到上百人不等[3] - 千寻智能将整层空间改造成数据工厂 配备机械臂和实时监控系统 每天能采集上千条动作数据 按月形成可调用能力库[5][6] - 北京人形机器人创新中心1:1复刻厨房 卧室 加油站等场景 月均采集超过上万小时动作数据 跻身全国第一梯队[3][7][8] 数据采集技术方法 - 基础动作由采集员完成 复杂操作由工程师佩戴VR设备远程控制 千寻智能训练效率提升近七成 新动作训练从需六七百条数据降至不到百条[6] - 采集任务分为高复用性通用动作场景和企业定制场景 某品牌冷柜标准作业流程采集需上千小时[7] - 星海图科技发布国内首个开放场景真机数据集GalaxeaOpen-WorldDataset 来自50个真实场景 总时长超500小时 涵盖234种任务 发布一周下载量突破8万[18] 资本投入与政策支持 - 千寻智能2024年初成立以来获得近6亿元融资 投资方包括京东 小米系 宁德时代系与中东资本[6] - 星海图完成近15亿元融资 获得美团 今日资本领投 北京机器人基金 亦庄国投跟投[20] - 北京亦庄出台政策对数据采集标杆实训场给予每场所10万元奖励 高质量数据集最高支持200万元 每年发放1亿元"数据券" 单个采购主体年度最高补贴不超过100万元[18] 数据采集人才体系 - 具身智能训练师分为动作采集员 数据审核师和算法工程师三类 采集员日均采集50至200条 熟练者达千条 审核师日审核上千条[22] - 采集岗月薪5000-6000元 审核岗年薪达8万元 核心训练师年薪15万-20万元 算法工程师月薪起薪2万元 最高可达10万元[22] - 采集员入职前需通过VR适应性测试 淘汰率超50% 招聘偏好身高160-170厘米 动作协调 体型标准者[21] 技术路线分化 - 真机数据采集与合成数据两种技术路线并行 银河通用采用"虚实结合"范式 用10亿级合成数据训练 仅用200条真实数据让机器人学会抓取饮用水并泛化到不同品牌[26] - 行业普遍使用仿真数据与真机数据比例约为9:1 北京人形同步构建高保真合成数据 人类视频数据等多元体系[28] - 京东集团高级副总裁何晓冬认为真机采集与合成模拟是互补组合 具身智能企业应尽快让机器人走进现实世界参与工作[28] 应用场景拓展 - 北京亦庄开展"具身智能社会实验计划" 在药房 图书馆 酒店等近百个真实采集点位构建人机协同网络 计划扩展至上千个实景场所[12][17] - 七鲜超市进行补货训练 每天采集20多个微任务 人流密集对采集作业产生干扰但环境还原度最高[14][15] - 北京人形打造国内首个基于真实场景的具身智能训练平台 计划年底前完成20余个真实场景布局 承担采集员培训与认证职能[20]
机器人北京上学记