具身机器人的大脑和小脑分别负责哪个任务?
具身智能之心·2025-11-19 00:34

具身智能行业概述 - 具身智能是通用人工智能(AGI)的关键方向,强调智能体与物理环境的交互与适应,使其具备感知环境、理解任务、执行动作并反馈学习的能力 [1] - 具身智能的核心模块包括大脑(负责思考感知和任务规划)和小脑(负责高精度运动执行) [1] 国内外产业布局 - 近2年,星海图、银河通用、逐际动力等明星团队从实验室走向商业和工业界,推动具身本体和大小脑技术进步 [3] - 华为于2024年底启动"全球具身智能产业创新中心",与乐聚机器人、大族机器人等企业合作建设具身智能大脑、小脑等关键技术 [5] - 京东自2025年5月以来连续投资智元机器人、千寻智能、逐际动力等公司,以强化物流科技与家庭服务场景的效率与服务能力 [5] - 腾讯、蚂蚁集团、小米等科技巨头也积极通过战略投资与合作布局,加快构建具身智能产业生态 [5] - 国外方面,Tesla/Figure AI在工业与物流机器人应用上持续推进,美国投资机构积极支持Wayve、Apptronik等公司落地自动驾驶与仓储机器人 [5] - 国内企业以产业链投资与综合平台驱动具身智能落地,国外科技巨头侧重基础模型、模拟环境与类人机器人原型研发,双方加速进入关键竞赛阶段 [5] 技术演进路径 - 第一阶段技术研究聚焦抓取位姿检测,通过点云或图像预测末端执行器姿态实现静态物体抓取,但缺乏对任务上下文和动作序列的建模 [6] - 第二阶段进入行为克隆阶段,机器人借助专家演示数据学习从感知到控制的端到端映射,具备模仿人类完成复杂任务的能力,但泛化能力弱、误差累积 [6] - 第三阶段兴起Diffusion Policy方法,通过扩散模型生成整个动作轨迹,提升策略稳定性与泛化能力 [6] - 2024年进入Vision-Language-Action模型阶段,融合视觉感知、语言理解与动作生成模块,支持零样本或小样本快速泛化,体现从"感知+控制"向"感知+推理+行动"的范式跃迁 [7] - 2025年业界探索VLA模型与强化学习、世界模型、触觉感知等模块融合,提升长时任务试错能力、环境动态预测能力和多模态融合感知能力 [9][11][12] - 技术演进从低层感知到高层理解,逐步迈向通用任务和开放环境的智能体时代,推动人形机器人、机械臂、四足机器人等产品在工业、家居、餐饮、医疗康复等领域落地 [14] 工程与系统能力需求 - 随着产业界重视,具身智能从"论文"走向"部署",对工程能力提出更高要求 [19] - 工程能力需求包括在Mujoco/IsaacGym/Pybullet等平台完成策略训练与仿真测试,训练并部署Diffusion Policy/VLA/力触融合的VLA模型,实现强化学习在VLA后训练上的应用,以及实现从世界建模预测到策略学习再到物理执行的一体化具身智能架构 [19]