Workflow
王兴兴:机器人最大的问题还是AI模型?大模型怎么不够用了?
机器人机器人(SZ:300024) 36氪·2025-09-15 00:21

核心观点 - 机器人硬件已足够支撑1-2年使用 但AI大模型在多模态融合和实际控制应用方面能力不足 阻碍了机器人智能水平提升 [4] - 大模型虽在语言和视频单模态表现良好 但结合语言与图像的跨模态理解仍是难点 导致无法有效驱动硬件执行复杂任务 [4] - AI在信息处理领域表现优异 但在物理世界"干活"领域仍处于早期发展阶段 尚未迎来爆发性增长 [4] 机器人硬件与AI模型发展差异 - 机器人硬件近年来显著进步 传感器和执行器使机器人具备环境感知和运动控制能力 已完全满足当前应用需求 [10] - 硬件进步未转化为智能提升 因大模型思维方式与人类存在巨大差异 缺乏直觉经验和本质理解能力 [11] - 人类凭本能完成的任务 如物体用途识别和场景氛围理解 大模型需要大量标注数据和长时间训练才能实现 [11] 大模型应用局限性 - 仅能替代基础性重复性工作 如客服问答内容创作和工业自动化 但无法处理多步骤推理和跨领域知识整合 [11] - 处理家庭服务场景时表现力不从心 例如"找昨天快递"任务需要综合理解时间物品空间位置并具备视觉搜索能力 [12] - 目前处于工具化阶段而非智能体阶段 能力边界清晰 难以应对真实世界的模糊性与不确定性 [12] 多模态融合挑战 - 纯语言模型或纯视频模型效果非常好 但语言与图像结合仍是较大难点 影响机器人硬件效能发挥 [4] - 模型控制灵巧手等精密操作存在挑战 没有很好方法将硬件能力充分利用 [4] - 对隐喻双关语和文化背景表达理解不足 在人类语言微妙之处处理方面仍有很大差距 [8] 具身智能发展现状 - 工具化机器人可完成特定场景操作如搬运清扫 但距真正人类式工作仍有巨大困难 [14] - 需要具备生活常识情感理解和社交沟通能力 目前表演性动作与实际家务劳动需求差距巨大 [14] - 构建符合实际工作需求的大脑需要大量模型训练和实践积累 目前仍处于漫长发展道路 [14] 大模型进化方向 - 简单低质量增加参数规模意义不大 虽提升性能但带来训练成本高昂和推理速度慢等问题 [15] - 需优化训练方法和算法 提高训练效率和质量 以更少数据和计算资源获得更好性能 [15] - 加强大模型与机器人硬件深度融合 通过传感器数据实时反馈实现软硬件协同优化 [15]