Workflow
具身智能之心
icon
搜索文档
有几个Top具身公司的大模型、强化学习、VLA和具身导航岗位!
具身智能之心· 2025-07-10 03:36
多模态大模型职位 - 工作地点为北京和深圳,月薪范围为40k-80k [2] - 研究方向包括移动操作、导航和VLA(视觉语言行动) [2] - 职责涵盖具身智能大模型框架设计、模型优化及下游任务训练部署 [2] - 要求计算机/人工智能/机器人相关专业硕士学历,具备机器人感知/导航/操作或AI大模型经验 [3] - 优先考虑有NaVid/MobilityVLA等机器人导航领域算法落地经验者 [3] - 加分项包括顶级会议论文发表、熟悉Transformer/RLHF算法、多模态数据处理经验 [4] 强化学习职位 - 工作地点为北京,月薪范围为40k-80k [5] - 研究方向包括强化学习和VLA [5] 具身导航算法职位 - 工作地点为深圳,月薪范围为30k-60k [6] - 研究方向包括多模态和VLN(视觉语言导航) [6] - 职责涉及多模态数据到规划的端到端映射及世界模型应用 [6][7] - 要求计算机/自动化/电子相关专业,具备机器学习/深度学习/强化学习基础 [7] - 优先考虑有ICLR/NeurIPS等论文发表或ACM/ICPC竞赛获奖者 [7] 岗位咨询方式 - 可通过添加微信Remix-clover咨询多模态导航移动基础模型相关岗位 [9] - 咨询需备注"具身之心+具体岗位" [9]
具身数采方案一览!遥操作和动捕的方式、难点和挑战(2w字干货分享)
具身智能之心· 2025-07-09 14:38
遥操作技术发展现状 - 遥操作概念起源于太空探索和军事领域,已有数十年历史,早期应用于手术机器人和远程挖掘机等场景[6][10] - 具身智能的兴起使遥操作技术重要性显著提升,主要因其在数据采集方面的关键作用[15][17] - 当前主流遥操作方案包括同构臂控制、VR操控和视觉动捕技术,其中纯视觉IK方案因操作自由度优势获得专家认可[21][29][31] 技术挑战与解决方案 - 系统延迟是核心瓶颈,整体延迟需控制在40毫秒以内以避免眩晕,远程操作普遍面临100毫秒延迟难题[34][118] - 异构映射问题突出,特别是手部操作环节,需设计新型reward函数优化人手到机械手的转换[83] - 动捕系统面临精度与自由度平衡难题,光学方案精度高但设备复杂,纯视觉方案便捷但存在遮挡问题[74][94][96] 行业应用场景 - 医疗领域已实现四手手术机器人系统,医生通过同构操作台完成精密手术[6] - 工程机械领域出现远程遥控挖掘机,操作员可在空调房内完成作业[6] - 人形机器人控制提出驾驶舱概念,通过多功能按钮集成实现移动与关节协同操作[68][71] 技术演进方向 - 未来可能形成纯虚(纯视觉)与纯实(力反馈外骨骼)两种互补方案[38][45] - 智能辅助系统将成为关键,类似汽车ESP的自动补偿机制可提升操作效率[125][126] - 脑机接口被视为终极解决方案,可绕过当前感知-动作转换链条的直接控制[37][144] 行业生态建设 - 标准化缺失制约发展,ALOHA系统首次提供完整硬件算法套件但尚未形成行业标准[103][109] - 机器人操作系统需从功能模块导向转向以人为中心,类似Windows的交互范式变革[146][147] - 封闭生态趋势显现,各厂商自定义中间件导致底层适配工作量大,亟需统一平台[159][160] 商业价值展望 - 遥操作将长期存在,即使实现AGI仍需要保留人类参与感和控制权[134][136] - 分身应用场景潜力巨大,可实现跨空间实体存在,但受限于图传等技术瓶颈[61][122] - 设计理念转向"Teleoperation First",将遥操作作为产品核心而非过渡方案[161][162]
灵活迅捷,开发友好,魔法原子最新人形机器人 Z1 来了
具身智能之心· 2025-07-09 14:38
产品发布 - 魔法原子发布新款双足人形机器人MagicBot Z1,采用"高性能可靠本体+开放AI生态系统+丰富场景落地应用"三位一体策略 [1] - MagicBot Z1拥有24基础自由度,可扩展至49自由度,关节最大扭矩超过130N·m,支持320°运动范围 [1] - 产品具备"大扰动冲击恢复"、"连续倒地起身"等高爆发运动能力,支持"下腰"等高难度动作 [1] 硬件性能 - 采用高强度铝合金和工程塑料,通过拓扑优化和正向分析设计提升抗摔、抗磨损能力 [5] - 利用热仿真技术优化整机结构与风道设计,确保长时间稳定性能输出 [5] - 配备3D激光雷达、深度相机、双目相机等传感器,搭载自主定位导航系统 [7] 开发平台 - 开发者可在20分钟内掌握一套全新动作,加速机器人训练 [9] - 提供标准机器人控制器,依托鲁棒运动控制算法适应不同地形与环境 [9] - 多源数据库和标准控制器助力开发者快速开发自有控制器及应用案例 [9] 交互能力 - 具备拟人化情感交互能力,基于多模态交互构建拟人化系统 [13] - 支持语音交互和拟人化动作如扭头、招手等 [13] - 通过视觉和触觉感知信息改变机器人冰冷形象 [13] 产品定位 - 提供标准版和开发版两大系列,开发版可选装灵巧手、高性能算力包等 [15] - 标准版为爱好者提供入门体验,开发版支持科研教育、商业服务等多场景应用 [15] - 公司总裁表示产品重新诠释"智能体"概念,具备超越人类的运动能力和智能感知 [15] 公司背景 - 全球领先具身智能科技公司,专注人形机器人研发、生产与产业化 [16] - 拥有全栈自研软硬件技术,覆盖关节模组、灵巧手等核心零部件 [16] - 核心团队来自行业顶尖企业,产品已实现量产及交付 [16] 融资情况 - 2024年12月至2025年5月完成两轮超亿元融资,总融资额超2.5亿元 [17] - 资金用于具身智能技术研发、VLA模型搭建及工业/商业场景落地 [17] - 自研核心零部件占比达90% [17]
VLA爆发!从美国RT-2到中国FiS-VLA,机器人的终极进化
具身智能之心· 2025-07-09 14:38
具身智能与VLA模型发展 - 2025年全球具身智能赛道爆火,视觉语言动作模型(VLA)成为核心驱动力,从美国RT-2到中国FiS-VLA实现技术快速迭代 [4][6][7] - 谷歌DeepMind、Figure AI等硅谷领军企业加速布局VLA,谷歌发布首个离线VLA模型实现机器人精准离线操控 [8][9] - 中国智平方联合高校推出FiS-VLA模型,通过快慢双系统架构解决机器人操控效率与推理能力矛盾问题 [10][12] 技术演进关键节点 - 谷歌RT-1(2022年)开创机器人Transformer模型,首次实现"预训练+微调"范式,完成多步骤任务如"把可乐放入冰箱" [23][25][27] - 微软ChatGPT for Robotics(2023年)实现零样本任务规划,但暴露语言模型在动作控制上的局限 [31][32][34] - 谷歌RT-2(2023年7月)确立VLA范式,将动作离散化为文本token联合训练,在未见任务上成功率超50% [38][39][40][46] 中国技术创新突破 - 智平方推出RoboMamba模型,引入Mamba架构使推理速度达主流模型3倍,仅微调0.1%参数实现SE(3)位姿预测 [45][47][50][52] - HybridVLA模型融合自回归与扩散架构,在仿真任务成功率提升8%,真实环境提升11% [74][77][79] - FiS-VLA实现21.9Hz控制频率,是CogACT的2倍以上,在RLBench任务平均成功率69%领先基线方法 [105][114][115] 国际竞争格局 - 开源模型OpenVLA以7亿参数超越55亿参数的RT-2-X,29种操作任务成功率高出16.5% [54][57][58] - Figure AI发布Helix双系统模型,系统1(80M参数)与系统2(VLM主干)实现7-9Hz工作频率 [88][89][93][96] - 英伟达开源GROOT N1人形机器人基础模型,融合互联网与机器人数据实现广义推理 [97][98][101] 行业应用前景 - VLA技术推动机器人从实验室走向工业落地,已在人形机器人和智能制造领域部署应用 [123][124] - π系列模型实现开放世界泛化,在未见家庭场景零样本完成清洁任务,标志技术具备大规模推广能力 [63][69][70] - 技术演进形成"自回归到扩散到混合"与"非端到端到快慢耦合"双路径,推动机器人向通用能力进化 [122]
智元先于宇树上市?星海图最新A轮融资超1亿美元
具身智能之心· 2025-07-09 03:30
智元机器人收购上纬新材股份 - 智元机器人将收购上纬新材至少63.62%股份 交易完成后控股股东变更为智元机器人及其管理团队共同持股的主体 实际控制人变更为邓泰华 核心管理团队包括B站UP主"稚晖君"等 [1] - 智元机器人已推出"远征""精灵""灵犀"三大产品线 覆盖交互服务 工业制造 商业物流与科研教育等场景 预计2025年出货量达数千台 [1] - 此次交易可能成为"国九条"与"并购六条"发布后新质生产力企业在A股的标志性案例 也是具身智能领域首个登陆科创板的收购项目 [1] - 智元机器人已完成多轮融资 3月获腾讯领投 龙旗科技 卧龙电气等跟投 5月京东 上海具身智能基金加入 估值突破150亿元 [1] 国产机器人赛道动态 - 宇树科技完成C轮融资并股改 传出科创板IPO计划 智元机器人通过"借壳"方式率先迈出上市关键一步 [2] 星海图融资进展 - 星海图完成A4轮及A5轮战略融资 合计超1亿美元 A4轮由今日资本 美团龙珠领投 中金保时捷基金 襄禾资本等跟投 A5轮由美团龙珠 美团战投领投 北京机器人基金超额加注 [3] 具身智能之心知识星球资源 - 社区成员来自斯坦福大学 清华大学等高校及智元机器人 优必选等企业 覆盖近40+开源项目 60+数据集 [11] - 技术学习路线包括具身智能感知 强化学习全栈 VLN VLA 多模态大模型 机械臂策略 双足/四足机器人等16个方向 [11] - 汇总国内外40+具身智能实验室 公司涉及教育 宠物 工业等方向 包含大模型 人形机器人行业研报 [14][17][19] - 提供机器人导航 动力学等书籍 PDF 零部件品牌清单 开源项目 仿真平台 ToF相机技术手册等资源 [22][24][26][28][31] - 专项整理触觉感知 多模态大模型理解/生成 Diffusion Policy 机械臂抓取等前沿领域技术资料 [41][43][45][51][59] 行业交流与案例 - 社区定期举办行业大佬直播 成员可自由提问工作选择 研究方向等问题 案例显示某控制专业学生咨询具身智能仿真项目建议 [64][67][68]
具身智能论文速递 | 强化学习、VLA、VLN、世界模型等~
具身智能之心· 2025-07-08 12:54
强化学习提升VLA泛化能力研究 - 清华大学等机构通过PPO算法微调视觉-语言-动作模型(VLA),OOD场景任务成功率提升42.6%,语义理解任务成功率从61.5%提升至75.0%,动态干扰场景成功率从28.6%跃升至74.5% [2] - 构建了评估VLA微调方法泛化能力的多维度基准,验证PPO优于GRPO和DPO算法,并提出共享actor-critic骨干网络、模型预热等高效微调方案 [4] - 强化学习在VLA的语义理解和实体执行泛化能力上超越监督微调(SFT),视觉鲁棒性与SFT相当 [4] NavMorph自进化世界模型技术 - 中科院突破NavMorph技术,在R2R-CE基准未见环境中成功率(SR)达47.9%,路径长度加权成功率(SPL)提升至33.2% [13] - 模型通过World-aware Navigator推断环境动态潜在表示,结合Foresight Action Planner实现前瞻决策,Contextual Evolution Memory机制支持动态环境行动规划 [15] - 实验显示NavMorph在VLN-CE基准全面领先:单目相机场景下Test Unseen的SR达45.7%,全景相机场景SR提升至60%,SPL达52% [18] 行业技术进展 - 视觉语言导航领域主流方法对比显示,NavMorph在Val Unseen场景SR较基准最优模型(ETPNav*)提升7个百分点,SPL提高4个百分点 [18] - 具身智能领域形成产学研社区,近200家公司及研究机构参与技术交流,涵盖招聘、学习资源及前沿技术更新 [23]
为什么人形机器人不容易落地?移动操作更受欢迎?
具身智能之心· 2025-07-08 09:31
具身智能产业落地分析 - 人形机器人短期内难以实现稳定部署 因本体稳定性不足 摔倒风险高 维修成本昂贵 责任归属不明确 [1] - 移动操作+机械臂方案更易落地 如银河通用G1在家居 超市等场景表现优异 [1] - 智元远征A2-W在工业领域应用突出 稳定底盘设计满足高负载施工需求 [2] 数据与技术瓶颈 - 需建立大规模基础模型预训练数据集 场景数据采集效率与质量决定规模化能力 [4] - sim2real方案虽降低数据采集成本 但真实场景性能迁移仍是待突破难点 [4] 行业生态建设 - 具身智能之心知识星球整合40+开源项目 60+数据集 覆盖强化学习 多模态大模型等18个技术路线 [13] - 社区汇聚斯坦福 清华等高校实验室及优必选 小米等200家头部企业成员 [13] - 提供仿真平台汇总 零部件品牌清单 工业研报等15类资源 支持从学术到产业全链路需求 [18][20][25][27][33] 人才发展支持 - 汇总国内外40+高校实验室研究方向 助力升学与职业规划 [14] - 提供机械臂抓取 双足机器人等24个领域的仿真项目实践方案 [59][61] - 定期组织行业大佬直播 分享VLM应用 分层决策等前沿议题 [15][65] 商业化进展 - 行业关注重点转向具身智能与大模型部署 强化学习应用等方向 [13][35] - 头部企业已布局教育 医疗 物流等细分场景 形成差异化竞争格局 [18]
重磅分享!VR-Robo:real2sim2real助力真实场景下的机器人导航和运动控制
具身智能之心· 2025-07-08 09:31
技术框架 - 提出"真实-仿真-真实"框架,通过多视角图像进行3D高斯溅射(3DGS)场景重建,构建兼具照片级真实感与物理交互特性的"数字孪生"仿真环境 [2] - 框架支持视觉导航与运动控制的协同学习,实现纯RGB输入的仿真到现实策略迁移 [2] 应用场景 - 方法在家庭和工厂场景中具有应用潜力,支持视觉目标追踪任务 [2] - 实验表明该方法能促进策略在新环境中的快速适应与高效探索 [2] 技术优势 - 解决"仿真与现实差距"问题,特别是缺乏真实感视觉渲染阻碍高阶任务的问题 [2] - 通过3DGS场景重建技术提升仿真环境的真实感与物理交互特性 [2] 相关资源 - 论文标题为《VR-Robo: A Real-to-Sim-to-Real Framework for Visual Robot Navigation and Locomotion》 [3] - 项目链接和论文链接已公开 [3]
星动纪元再获5亿融资!团队大牛伯克利和清华交叉信息研究院背景
具身智能之心· 2025-07-08 00:14
公司融资与背景 - 星动纪元完成5亿元A轮融资 由鼎晖资本和海尔资本联合领投 厚雪资本、华映资本、襄禾资本、丰立智能等跟投 老股东清流资本、清控基金继续追加投资 [1] - 融资资金将用于人形机器人软硬技术研发与量产落地 推动"模型-本体-场景数据"闭环飞轮运转 [1] - 公司成立于2023年8月 由清华大学交叉信息研究院孵化 是唯一一家清华大学占股的人形机器人企业 [3] - 创始人陈建宇为清华大学交叉信息研究院助理教授、博士生导师 拥有UC Berkeley博士背景 师从美国工程院院士Masayoshi Tomizuka教授 [3] 技术资源与社区 - 具身智能之心知识星球汇总40+开源项目、60+具身智能数据集、行业主流仿真平台及技术学习路线 [9] - 技术路线涵盖具身感知、强化学习、多模态大模型、机械臂控制、机器人导航等25个细分领域 [9][31][33][37][57] - 社区成员来自斯坦福、清华、ETH等高校及优必选、小米、逐际动力等头部企业 [9] - 提供国内外80+具身智能公司及实验室信息 覆盖教育、医疗、工业等应用方向 [12][15] 行业动态与人才发展 - 整合30+具身智能研报 跟踪大模型与人形机器人行业落地进展 [17] - 汇总机器人零部件品牌 包括芯片、激光雷达、IMU等核心部件供应商 [22] - 定期举办行业大佬直播 分享学术进展与工业应用 并提供企业岗位对接服务 [14][62] - 仿真平台资源支持无实物设备的研究 如Isaac Sim等框架可完成机械臂抓取等仿真项目 [29][67]
亚马逊100万机器人上岗!即将超越人类员工?机器人军团接管工作
具身智能之心· 2025-07-07 09:20
亚马逊机器人部署里程碑 - 公司全球仓库已部署第100万个机器人,最新一台位于日本物流中心[3][4] - 机器人类型包括机械臂、轮式运输机器人、自动分拣系统和打包机器人[5][6] - 目前75%的配送任务有机器人参与[7] 机器人技术升级与效率提升 - 新型Vulcan机器人具备双臂操作和触觉功能,能处理75%库存商品[15][16][18] - 生成式AI模型DeepFleet优化路径规划,提升机器人运行效率10%[10][11] - 路易斯安那州新物流中心机器人数量达现有10倍,商品流转速度快25%[44][48] 人机协作与岗位转型 - 公司培训70万员工转向高薪岗位,与机器人协同工作[22] - 员工案例显示转型后工资增长2.5倍,工作内容转为管理系统[25][26] - 分拣系统将商品送至员工面前,机器人协助抓取深处货物[30] 自动化对劳动力市场影响 - 每仓库平均员工数降至670人(16年最低),人均处理包裹数从175增至3870个[36][37] - 公司过去几年裁员27,000人,CEO称AI将重塑劳动力结构[67][59] - 作为美国第二大私营雇主,公司自动化趋势被视为行业风向标[56] 未来技术布局 - 测试人形机器人(带腿/手臂/头部)执行回收容器任务[53] - 下一代物流中心计划推进机器人全面整合[43][53] - AI已应用于代码编写、数据分析和研究等创新领域[64]