Workflow
GPT - 4.0时代
icon
搜索文档
具身智能还需要一个「五年耐心」
36氪· 2025-09-17 08:12
行业现状与核心瓶颈 - 具身智能行业,特别是人形机器人赛道,当前最热门的叙事是进入工业产线,但现实挑战巨大,通用机器人以牺牲“精准性”和“效率”为代价,与产线核心需求错位[2] - 当前通用机器人(尤其是人形机器人)的核心价值更偏向“情绪价值”,即通过技术进步引领社会共识和获取资源,而非立即产生商业化落地价值,许多宣传的落地场景是展示性或实验性的[3] - 行业普遍预期,具身智能有望在未来1-2年内迎来其“GPT-3.0时刻”,即在实验室环境下看到通用模型(大脑+小脑)的明显技术突破并对主流路线达成共识,但从该时刻到公众可用的“GPT-4.0时代”仍需约五年耐心[4][12] 关键技术挑战:数据瓶颈与范式转移 - 数据获取是当前具身智能赛道最窄的瓶颈,从现实世界通过遥操作或示教采集数据存在规模小、成本高、多样性不足三大局限,难以满足训练需求[6] - 与自动驾驶领域能以极低边际成本获取海量真实数据不同,通用机器人领域完全不具备这种数据获取优势[7] - 行业正推动范式转移,通过高精度物理引擎将“数据问题”转化为“算力问题”,在仿真环境中用代码自动化生成无限、多样化的数据,过去需团队数月采集的数据,现在可能只需一堆显卡运行一晚[8] - 仿真数据可高效解决模型从0到90%的能力广度问题,但最后从90%到99.999%的可靠性鸿沟,即“仿真到现实的差距”,必须依靠真实世界的数据来弥合[9][10] 物理世界约束与演进路径 - 具身智能从“GPT-3.0”到“4.0”的演进面临独特的物理约束,其“试错成本”与“物理世界的回环速度”与大模型不在一个量级,机器人一次错误可能导致财产损失或安全事故,且物理迭代速度以秒或分钟计,远慢于数字世界的毫秒级迭代[10] - 引入大规模人类反馈的前提是硬件的大规模部署,但大规模部署又要求机器人先达到极高的可靠性和性价比,这个“先有硬件部署,还是先有成熟智能”的矛盾是软件世界不存在的巨大障碍[11] - 物理世界的“长尾问题”复杂性呈指数级上升,同一个任务因物理参数的微小变化都可能导致失败,其极端案例的分布远比文本世界密集和致命[11] - 基于上述约束,理性预期是需要1-2年迎来“GPT-3.0时刻”,再需3-4年进行硬件铺开、真实数据积累和长尾问题攻克,才能迈向可靠可用的“GPT-4.0时代”[12] 潜在终局玩家画像 - 能够跑完具身智能漫长赛道的终局玩家需具备四大要素:世界一流的AI团队、海量的真实世界数据、顶级的工业制造能力、雄厚的资本与坚定的信念[13][14][15][16] - 目前最突出的潜在头部玩家是马斯克,其同时拥有顶级AI团队、雄厚资本、强大信念,更关键的是在“数据闭环”和“工业制造”上已展现世界级统治力,具有结构性优势[16]