VWA模型
搜索文档
鹏城实验室出品,一座“世界模型”融资数亿元
36氪· 2025-12-02 03:56
Meta的AI战略与人才布局 - 在过去一年中,Meta为吸引来自OpenAI、Anthropic等头部公司的人才,开出了高达1亿美元的跳槽奖金[1] - 为收购天才少年汪涛创办的Scale AI并使其团队加入,Meta耗资148亿美元[1] - 公司邀请前Y Combinator合伙人丹尼尔·格罗斯及其风险投资基金NFDG的合伙人纳特·弗里德曼加入,以组建Meta的首只产业基金(CVC)[1] 技术路线转向:“世界模型” - Meta首席科学家杨立昆(图灵奖得主)宣布将于年底离职,并认为当前大语言模型对物理世界理解能力很差,是“死路一条”,主张发展“世界模型”技术路线[2] - “世界模型”旨在使AI能够预测一系列行动对世界产生的影响,具备人类级别的物理空间理解能力[5] - 知名华人科学家李飞飞同样认为,人工智能下一个十年的主要方向应是具备空间智能的“世界模型”[5] 当前AI模型的局限性 - 大语言模型仅能推理下一个最符合逻辑的词元或像素,缺乏对三维世界的真正理解,例如在给定门、桌子、人肩宽数据时,会忽略组合宽度等物理规律[4] - 视觉—语言—动作模型(VLA)存在两大缺陷:视觉输入压缩至语言token空间会丢失几何信息;模型泛化能力有限,对环境变化极度敏感[6] - 这些缺陷导致AI在物理空间中能力不足,使通用人工智能(AGI)的实现看似“无底洞”,并引发市场对“大模型烧钱”的焦虑,Meta股价曾在相关言论后暴跌12.6%,市值蒸发近2400亿美元[7] 中国公司的解决方案:拓元智慧的VWA模型 - 拓元智慧完成数亿元Pre-A轮系列融资,投资方包括东方精工、星宸科技、德韬资本、石溪资本、粤科创业等战略及产业投资方[2] - 公司提出VWA(Vision-World-Action)模型架构,区别于VLA,可直接在物理空间进行推理与决策,避免视觉信息压缩带来的信息丢失[10][11] - 核心物理自回归模型(PAR)在机器人操作基准ManiSkill的PushCube任务上实现100%成功率,且无需动作预训练[11] - 模型采用Tweedie Framework提升控制准确性,并引入Eon计算机制增强效率与长序列建模能力[12] - 依托新架构与海量真实预训练数据,模型适配所需数据极少(可仅需一条示例),参数更新规模极小(约4000个参数),能实现新环境在线快速适配[13] 投资方背景与战略协同 - 投资方东方精工聚焦高端智能装备制造,正布局“人工智能+具身智能机器人”全产业链生态[13] - 投资方星宸科技是视觉AI SoC芯片全球出货量第一的企业,为智能机器人等领域提供解决方案[14] - 德韬资本作为金牌家居产业投资平台,聚焦泛家居产业链、人工智能、机器人等领域[15] - 石溪资本由集成电路存储龙头企业发起,在半导体、人工智能领域有广泛布局[15]