文章核心观点 - 具身智能是当前贝塔最高的投资赛道,但其核心“大脑”部分的技术范式尚未收敛,仍处于探索突破阶段[3][4] - 中国在具身智能大脑的研发上存在独特的技术路径(如类脑计算),并有望实现领先,但国内在资金和数据投入上与国外差距正在拉大[8][14][24] - 解决数据稀缺和计算效率问题是具身大脑落地的关键,不同公司通过类脑解耦、世界模型预训练及自动化数据处理等不同方式应对挑战[12][14][16][17] - 具身大脑的成熟将实现本体无关和场景泛化,其技术范式有望在2年内初步收敛,并将催生比语言大模型更大的市场和更多的巨头公司[20][21][26][27] 行业现状与挑战 - 具身智能是过去几年最热、贝塔最高的投资方向,但“大脑”部分远未成熟,其“DeepSeek、ChatGPT时刻”尚未到来[3][4] - 国内与国外在具身大脑领域的差距不是在缩小,而是在变大,主要原因是国外企业获得更多资金用于数据Scaling,每周有上十万小时的数据持续回流[8] - 国内在大脑的投入远远不够,而技术范式已从去年年底、今年年初开始向视频预训练切换,特斯拉Optimus团队、Figure的Go-Big项目都在进行相关实践[8] - 具身智能的数据非常少,现有数据量仅对应3-5岁小孩的水平,远未达到成年人的能力预期[14][15] 公司技术路径与方案 千诀科技 - 公司孵化于清华类脑中心,致力于打造一个可让所有机器人使用的“缸中之脑”,该大脑不分形态,可持续学习、自我演化和分化分区[4] - 技术核心是类脑计算与解耦,模仿人脑分区独立优化与演化的机制,而非端到端模型,这种方式可将样本效率提高至少一万倍[5][16] - 已完成第三代模型的预训练,并在7大类、20多小类机器人形态上完成适配,与头部公司合作,预计明年将有10万台设备接入其大脑[4] - 已实现“四个跨”的自主智能泛化:跨场景、跨物体、跨任务、跨形态,机器人可在无人类指令下仅凭出厂设置和通识预训练工作[25] - 认为中长期解决方案是“类脑大模型+类脑芯片”,以解决端侧部署的功耗与性价比矛盾,中国在此技术路线上全球领先[24] 流形空间 - 公司聚焦于构建世界模型驱动的具身大脑,技术孵化自清华大学电子系的FIB实验室,团队是国内最早研究世界模型的工业界团队之一[6][7] - 已开发出对标李飞飞RT-M的、可单图生成可交互空间的基础世界模型,并应用于机器人大脑和无人机[6] - 技术范式区别于VLA,其通过空间智能的世界模型预训练再部署到机器人,认为VLA路线因通信带宽低、泛化性差,不适合作为大脑基座[6][7] - 拥有全栈自动化数据处理能力,内部有超过100个计算机视觉算子自动化处理视频标签,无需人工,旨在将数据变为公司资产[12][13] - 认为世界模型应是数据驱动的黑盒模型,以避免人为先验知识限制其能力上限,坚信机器智能最终将超越人类(ASI)[19] 关键技术范式探讨 - 世界模型的定位:世界模型应是对世界的极致压缩,是机器人的Foundation Model,而不仅是环境模型[11] - 世界模型的类型:主要分为两种范式,一种是构建人能看见的、输出视频的显空间世界模型;另一种是构建编码高维世界知识的隐空间世界模型,后者可能更具发展潜力[9][10] - 白盒与黑盒之争:对于世界模型是否可解释存在分歧,一方认为基于因果推理的模型应是白盒;另一方则认为数据驱动的视觉模型必然是黑盒,其能力上限不应被人为理解所限制[18][19] - 实现路径:要实现通用机器人,需要两个阶段:首先是世界模型预训练提供通识教育(0-60分能力),其次是结合具体场景的软硬一体后训练进行过拟合,兜底性能下界[21][22] 发展预期与落地展望 - 技术范式收敛时间预计在2年以内,前提是数据利用范式和管线得到提升[26] - 若追求处理更复杂的功能,具身大脑可能永远不会收敛到端到端范式,而是收敛到一个持续学习、动态变化的分区结构,类似于人脑[27] - 具身智能是比语言大模型更大的方向,未来将出现更多的创业公司和千亿级公司[27]
中国下一批千亿公司
投资界·2025-12-17 03:08