机器人泡沫大讨论:揭秘“虚火”下的真实逻辑
机器人机器人(SZ:300024) 36氪·2025-12-01 07:20

行业现状与定位 - 人形机器人赛道当前处于技术爆发前夜的“BERT时期”,技术路线已清晰,但尚未出现数据“涌现”的“GPT-3时刻”[2][3][4] - 行业存在“过热”现象,企业产能规划激进(普遍在年产10万至100万台),但大规模订单尚未落地,高盛预测到2035年全球出货量或仅为138万台[1][2] - 初创公司演示(如1X的Neo)被质疑严重依赖远程操控而非自主智能,引发对“人工”智能的讨论[1][2] 中美发展路径对比 - 美国公司战略偏“软”,专注于从基座大模型驱动具身智能进步,具有学院派和底层模型突破优势[11][13][14] - 中国公司优势在“硬”,拥有强大的硬件供应链和极快的迭代速度(如在深圳硬件产品可一天迭代三次)[13][15][16] - 特斯拉被视为目前将极致制造效率与顶尖软件能力结合最好的公司,体现了垂直整合的优势[16][56] 技术发展路径与投资逻辑 - 真正的“具身智能”被定义为数据驱动且大概率是人形,其与解决特定问题的“先进制造”或“智能硬件”是两种不同的投资逻辑[25][26][28] - 行业期待的第一个里程碑是“GPT-3时刻”,即海量数据训练出具有规模性能的模型,实现长期动作链的泛化能力[4][7][9] - 第二个里程碑是“ChatGPT时刻”,即通过后训练调优使产品达到可大规模使用的亮眼效果,并可能在C端出现规模性爆发[5][11] 商业化落地挑战与场景 - 当前面临“数据冷启动”困局,缺乏数据导致效果不佳,进而难以获得用户和数据,形成死循环[41] - 商业化将遵循从B端到C端的路径:首先是非常结构化的工业生产场景,其次是餐厅等半结构化B端场景,最后才是家庭等C端场景[43][59][60] - 目前工业场景(如车厂拧螺丝、物流翻箱)虽有真实需求,但机器人能力尚未达到,均处于不稳定演示阶段,故障率高[45][46][49] 核心能力与投资焦点 - 行业共识是“软件定义、软件驱动”,最具价值的投资焦点在于“大脑”,即基座模型、VLA(视觉-语言-动作)等端到端算法的研发[19][31][32][35] - 灵巧手是另一个关注重点,其操控涉及从软件到硬件的整体能力,但当前缺乏触觉等关键数据[36][37] - 垂直整合能力被视为关键壁垒,需要将软件、硬件、制造和场景落地深度融合[18][56] 硬件供应链与未来演进 - 硬件供应链已存在,但硬件本身进步线性,难以出现指数级爆发,当前发展依赖于软件算法利用现有硬件的能力[51][52] - 机器人硬件设计尚未定型,仍在快速演变中,下一步目标是提高硬件的坚固性和鲁棒性以降低返修率[55] - 未来硬件可能趋向采用“现货供应”模式,软件算法适配通用化、低配的硬件,而非等待特定硬件的巨大迭代[52][53] 未来五年预测 - 未来2-3年有望看到机器人的“GPT-3时刻”,即数据涌现并训练出收敛模型[56] - 未来5年可能迎来机器人的“ChatGPT时刻”,出现第一个实际的、泛化的应用场景并被接受,但距离安全、便宜地进入家庭还需更久[56][57] - “世界模型”方向可能成为解决数据稀缺问题的新路径,预计明年会有更明确的收敛方向[60]