Workflow
OPEN VLA
icon
搜索文档
质疑VLA模型、AI完全不够用?有从业者隔空回应宇树王兴兴
第一财经· 2025-08-11 14:51
行业核心观点 - 具身智能的AI能力不足是当前人形机器人行业面临的最大瓶颈 而非硬件问题[3] - 行业需重构VLA模型并寻求新的解决范式以突破感知 决策 执行的闭环断裂问题[4][7] - 强化学习和模仿学习需遵循Scaling law法则以实现机器人泛化能力和智能水平提升[4] 技术架构争议 - VLA模型被部分从业者质疑为"相对傻瓜式架构" 但仍是具身智能领域重要技术路线[3][5] - 当前最强通用机器人控制VLA模型π0仍无法有效运用全参数大型语言模型 且对数据要求极高[5] - 开源VLA模型OPEN VLA基于Llama2语言模型 参数规模为7B(70亿)相对较小[5] 系统协同挑战 - 人形机器人需要云端与终端算力协同分配 构建完整的"云网端"部署架构[6] - 理想技术体系需实现大脑(完整参数模型) 小脑(轻量化实时模型)和肢体的深度协同[5][6] - 当前大语言模型研究与端侧智能研究呈现割裂状态 未能有效融合[6] 三大核心痛点 - 感知局限:传统机器人依赖预设规则 难以理解复杂多变的环境动态性[5][6] - 决策断层:多任务切换需人工干预重新编程或调整策略[5][6] - 泛化瓶颈:面对新任务或场景需重新进行大量训练和调试[5][6] 发展前景与方向 - 2025年被行业普遍视为人形机器人量产元年 从业者从怀疑转向确信其产业重要性[7] - 需通过生物仿生等原创性研究提出具身智能基础模型新范式[7] - 行业发展依赖机制 理念 政策及从业者创新力的综合推动[7]
质疑VLA模型、AI完全不够用?有从业者隔空回应宇树王兴兴
第一财经· 2025-08-11 11:33
人形机器人行业挑战 - 传统人形机器人面临感知局限、决策断层、泛化瓶颈三大核心挑战[1][5] - 行业当前最大问题是具身智能AI完全不够用,硬件虽不够好但已够用[1] - 机器人难以理解复杂多变环境动态性,多任务切换需人工干预重新编程[5] - 面对新任务或场景需重新进行大量训练和调试[5] VLA模型争议 - VLA模型被质疑为"相对傻瓜式架构",感知-认知-决策-执行闭环尚未闭合[1][2] - 目前最强通用机器人控制VLA模型π0无法有效运用全参数LLM且对数据要求更高[4] - 业界需要重构VLA模型,寻求新解决范式,探索云端与终端算力协同分配[2][4][6] - 理想VLA模型不应简单等同于"小脑",需与大语言模型有效融合[4] 技术发展方向 - 强化学习与模仿学习都需要进入Scaling law法则提升机器人泛化能力[2] - 业界需构建完整"云网一端"部署架构,实现大脑模型完整参数与小脑模型体积突破[4][6] - 前瞻性思考通过生物仿生提出原创具身智能基础模型[6] - 当前技术研究呈现割裂状态,大语言模型与端侧智能尚未有效融合[4] 行业前景 - 2023年被称作人形机器人量产元年,从业者从怀疑转向确信其将成为重要产业[6] - 行业发展关键取决于机制、理念、政策及从业者战斗力与创新力[6] - 需推动人形机器人成为规模化、可落地的产业方向[6]