Workflow
RoboChallenge.ai
icon
搜索文档
开源对机器人的价值,远超想象丨唐文斌深度对谈抱抱脸联创
具身智能之心· 2025-10-21 00:03
文章核心观点 - 当前机器人研究面临“仿真到现实”的巨大鸿沟,许多模型在模拟器中表现完美但在现实世界中彻底失灵[2] - Dexmal与Hugging Face联合推出RoboChallengeai平台,旨在建立一个开放、统一、可复现的真实世界机器人评测基准[6][45] - 开源是推动物理智能/具身智能领域发展的关键驱动力,其重要性在机器人领域甚至超过在大语言模型中的作用[10][19][26] 行业痛点与挑战 - 机器人领域缺乏统一、开放且可复现的基准系统来公平比较不同方法、策略和模型[44] - 大多数现有基准仍基于仿真环境,由于“仿真到现实”差距,无法真实反映模型在现实中的表现[42][50] - 机器人评测面临硬件访问限制、环境变量控制、模型部署等多重技术难题[36][52][53] RoboChallengeai平台解决方案 - 平台首次实现全球研究者在物理环境中远程测试模型,通过独创的Remote Robot技术,用户仅通过API即可控制真实机器人[8][53] - 采用模型留在用户本地的部署方式,用户通过HTTP API访问平台摄像头和机器人进行远程测试,无需上传模型[53] - 以Table 30作为起点基准测试,提供30个任务,每个任务约1000个episodes的微调数据供开发者使用[53][61][62] 开源在具身智能中的作用 - AI领域几乎所有重大突破都基于开源,transformer架构及其演化都是全球开源社区协作的产物[10][11][12] - 开源使模型能够被应用到不同类型机器人上,实现“共同大脑”驱动各种机器人的新局面[22][23] - 本地化运行的嵌入式模型几乎都是开源模型,开源与硬件开发自然结合成为机器人领域演化关键动力[25][26] 平台发展愿景与规划 - 平台遵循完全开放策略,提供免费评测服务,任何人都可提交模型并获得排名[78][79] - 未来将扩展评测维度至多任务、长时任务、交互任务等更复杂场景[81] - 三到五年内,具身智能研究将向执行更长时间任务发展,基准测试随之演化[82] 公司背景与行业动态 - Dexmal成立仅20天即完成2亿元天使轮融资,投资方包括君联资本、九坤创投和启明创投[83][84] - 团队核心成员拥有超过十年AI原生产品与落地经验,在仓储场景已交付超过一万辆AMR/AGV[85] - 公司专注于将大模型和AI技术引入机器人领域,探索具身智能新赛道[86]
开源对机器人的价值,远超大模型时代的想象丨唐文斌深度对谈抱抱脸创始人
量子位· 2025-10-20 01:16
行业痛点与平台推出 - 当前机器人研究最大痛点是模型在仿真环境中表现完美,但一到现实世界就彻底失灵[1] - 为解决此痛点,Dexmal联合创始人唐文斌与Hugging Face联合创始人Thomas Wolf联合推出了开放、统一、可复现的真实世界机器人评测平台RoboChallenge.ai[5] - 该平台首次让全球研究者在物理环境中远程测试模型,用户可通过API控制真实机器人,而模型可保留在本地[6] 开源在物理智能中的作用 - AI领域几乎所有重大突破都基于开源,例如transformer架构本身就是Google开源的[9][10] - 开源是探索新领域的关键基础,新兴的VLA模型几乎都从开源模型出发,经修改后适配到机器人上[16][17] - 开源对机器人领域的重要性可能超过其在大语言模型中的作用,因为开源模型可被应用到多种不同类型的机器人上,形成一个共同的大脑[20][21] - 让模型本地运行在机器人内部具有重要价值,例如安全性,而目前几乎所有嵌入式模型都是开源模型[22][23][25] 开放基准测试的重要性与挑战 - 独立、客观的评估平台能帮助社区过滤噪音,避免被营销视频或夸张演示误导,这是当前机器人领域所缺乏的[33][34] - 在机器人领域进行真正评测非常困难,且存在大家倾向于展示机器人在最完美状态下表现的问题[35][36] - 建立一个统一、开放且可复现的基准系统,来公平比较不同方法、策略和模型至关重要[41][42] - RoboChallenge.ai旨在提供共享数据和标准化评估,研究者可远程提交模型并在真实机器人上进行实验,平台提供排行榜展示结果[50] RoboChallenge.ai平台细节 - 平台通过Remote Robots机制实现远程测试,用户无需上传模型,可通过HTTP API访问摄像头和机器人[52] - 平台以Table 30作为基准测试的起点,提供每个任务约1000个episodes的微调数据供开发者下载[52][59][60] - 平台建设面临诸多挑战,包括实现真实环境中可复现、公平的测试,以及定义基准本身[51][52] - 平台遵循完全开放策略,提供免费评测服务,目标是打造一个可复现、开放、统一的平台[76][77] 社区参与与数据挑战 - 数据是机器人学的一大瓶颈,社区在提供多样化数据方面可发挥关键作用[61][62][65] - 社区可在算法层面作出贡献,例如探索如何微调策略、设计训练架构等[66] - 最先参与的用户群体预计主要是学术界和初创公司,因为目前最强的基座模型主要由这些机构开发[56][57] - 社区精神对机器人和具身智能研究有重要推动作用,个人也可通过廉价机器人采集和分享数据来参与[63][64][68] 未来展望与发展方向 - 评测方式应多样化,包括仿真测试,未来会看到多种评测体系共存[72] - 三到五年后,具身智能研究将发展到机器人能执行越来越长的任务,从现在的几分钟到未来的几小时甚至更久[77] - 未来可测试的维度包括多模态感知、动态环境适应、长时序任务等[77] - 平台是迈向“真实世界基准”的重要第一步,未来将持续优化[74][75]