大规模

搜索文档
具身智能开源周:上海AI实验室加速助力机器人训练及应用
具身智能之心· 2025-09-15 00:04
上海AI实验室具身智能开源进展 - 上海人工智能实验室于7月开源具身全栈引擎Intern-Robotics 推动具身大脑从"碎片化开发"迈向"全栈化量产"时代 相关模型和数据集下载量超14万次[3] - 围绕导航、操作、人形机器人运动大模型及数据集评测等方向推出一系列技术新进展 计划于9月14日起集中开源 助力破解机器人从训练到应用场景落地核心难题[3] - 联合多个行业专业机构于9月17日、19日推出两场专题直播 帮助理解并运用相关技术[4] 导航大模型InternVLA N1 - 端到端双系统导航大模型实现长程空间推理与敏捷执行的有机融合 采用纯合成数据驱动异步架构的两阶段课程训练[6] - 模型在6个主流基准测试中得分达国际领先水平 以60Hz连续推理效率实现跨场景、跨本体零样本泛化[6] - 开源日期为2025年9月15日 相关资源包括模型、数据集及代码库[7][10] 操作大模型体系 - 构建覆盖"思考-行动-自主学习"完整闭环:具身操作"大脑"InternVLA M1负责空间推理与任务规划 "小脑"InternVLA A1负责运动执行 强化学习VLAC通过真实数据优化性能[8] - InternVLA M1采用两阶段训练策略 在SimplerEnv等公开操作基准达国际领先水平 真机场景中指令跟随与泛化能力显著优于GR00t和π0[11] - InternVLA A1基于虚实混合数据集训练 性能优于π0及GR00t n1.5 已适配方舟无限、国地青龙人形机器人等超5款机器人本体[12] - VLAC奖励大模型以InternVL为基座 融合互联网视频与机器人操作数据 为强化学习提供过程奖励和完成情况估计[12] - 操作模型系列开源日期覆盖2025年9月16日至18日 配套数据集与代码库同步开放[11][12] 人形机器人运动大模型InternHumanoid - 专为突破复杂运动控制技术瓶颈研发的全身运动控制工具链 核心特性为跨本体、跨技能[13] - 覆盖百余种运动类型 包括日常基础动作和舞蹈、格斗等复杂动作 实现精准动作追踪[13] - 同步开源的MotionMilions数据集与InternHumanoid Scamo7B模型 提升多模态控制可能性[13] - 开源日期为2025年9月19日 提供数据集与代码链接[14] 数据集与评测体系 - InternScenes数据集包含4万个室内场景和196万个三维物体 数据总量超现有同类开源数据集10倍 覆盖15个场景类别和288个物体类别[15] - 平均每个场景物体数量达41.5个(超同类2倍) 约20%物体可交互 为场景重建与空间智能研究提供数据基础[15] - OmniWorld数据集融合多模态与多任务 包含超61万个视频片段、总帧数超300M、额外模态标注超557M[16] - 基于OmniWorld微调的模型在重建、渲染等任务取得显著性能提升[16] - 高保真场景评测基座提供导航与操作两类评测 导航评测聚焦物理真实环境下的视觉语言导航 操作评测专注于长时序指令遵循任务[17] - 以评测为基础的IROS 2025挑战赛已上线 评测服务长期开放[17] 开源资源平台 - 官方资源平台包括官网、GitHub及Hugging Face 提供模型、数据集与代码访问[9] - 具体项目资源链接覆盖导航模型、操作模型、人形运动模型及数据集 均通过标准化平台发布[10][12][14][15][16]