2025人形机器人大时代 - 具身智能大脑的进化之路
机器人机器人(SZ:300024)2025-11-24 01:46

行业与公司 * 行业为人形机器人/具身智能行业[1] * 涉及的公司包括科技大厂(英伟达[2][18]、Meta[2][4][8][20]、亚马逊[2][20]、MIT[2][14]、西门子[19]、富士康[19])、人形机器人创业公司(智元[2][15][18][20][21]、银河通用[2][20][21]、千寻智能[2][20]、星海图[2][20][21])以及研究机构(斯坦福大学[17]、上海人工智能实验室[15])[2][4][8][15][17][18][19][20][21] 核心观点与论据 算法架构演进 * 机器人算法正从模型驱动转向数据驱动[2][3] * 当前存在三种主流算法架构[4] * 分层控制框架:适用于工业场景 但存在通信延迟问题[4] * VLA模型:适用于人机交互场景 是创业公司主流方向[4][9] * 世界模型:依赖高保真仿真 目前主要处于研究阶段 实际部署面临挑战(如机器人动作复杂度高、存在表征崩溃问题)[4][8] * 未来3-5年 三种技术路线将共存并互补发展 分层架构适用于工业落地 VLA模型在人机交互有潜力 世界模型由AI大厂主导探索[9] 数据的关键作用与获取路径 * 数据是连接硬件和算法的桥梁 其成本与价值量呈正相关[10] * 数据获取主要有三种路径[10] * 真机获取:高价值高成本 包括遥控操作、动捕等方式[10] * 视频学习:成本较低但费人 Meta和亚马逊在此有进展[2][10][20] * 仿真数据:多用于初创公司 需严格清洗筛选[10] * 跨本体训练是实现通用智能的关键 MIT和Meta在2024年9月发布了全球首个多类型机器人硬件结构的异构训练框架 智源等在2025年3月也有类似进展[14][15] 行业挑战与瓶颈 * 数据安全问题日益突出 已有企业因数据跨境传输引发负面舆情 欧盟等机构已启动相关研究[11][12] * 缺乏统一评测基准 导致行业进步程度难以衡量 斯坦福大学在2024年3月发布了全球首个具身智能模型benchmark——Behavior 1K 覆盖50个场景及1,000多项任务[17] * 尚未出现类似ChatGPT的具身智能基础模型 原因包括缺乏数据共享基础、多模态技术挑战、培训难度高成本大等 未来1-3年内出现大一统模型的可能性较低[16] 研发效率与生态系统 * 企业需提高研发投入效率 通过优化流程、加强协作、引入先进工具来应对发展需求[13] * 物理AI在仿真建模中发挥重要作用 支持复杂物理过程的建模和推理 英伟达视其为未来AI商用化的重要蓝海 并已应用于工业场景(如富士康模拟产线、西门子升级数控系统)[2][18][19] * 机器人软件生态系统由模型、数据分析、仿真模拟、开发工具及评测系统等构成 吸引了众多计算机上市公司参与 生态参与者主要包括科技大厂、人形机器人本体公司及底层工业软件/传感器厂商[2][21] 其他重要内容 * 2025年9月 斯坦福大学宣布成立首届Behavior挑战赛 以测试具身AI能力[17] * 2025年 混合专家模型等架构创新开始应用于具身智能领域 提高了有限资源下的训练效率[16] * 国内重视benchmark建设将加速技术发展与应用落地[1][17]