Workflow
3 + 1模式
icon
搜索文档
直击IROS现场:宇树禾赛自变量杭州论剑,美团C位攒局
具身智能之心· 2025-10-23 00:03
美团战略与场景落地 - 公司战略已从"零售"升级为"零售 + 科技",零售是场景,科技是赋能 [9][10] - 具身智能是未来5到10年核心技术范式,公司关键词是autonomy(无人化),旨在构建真正的"具身智能网络" [13][14][17] - 公司是全国唯一获得民航局许可在所有城市合法飞行且夜间也能飞的无人机运营商 [16] - 无人机可送汉堡披萨,无人配送车能从北京到深圳,机场酒店园区场景有小黄蜂承担闪购配送 [15][20] 技术理论框架与创新 - 港大席宁教授提出GAT模型,即生成对抗转导,让机器学习模型和解析模型彼此纠错循环迭代,实现生成性博弈 [25][26][28] - 提出非向量空间控制理论,在感知空间中直接控制,机器人行动不再依赖精确轨迹规划,而是从视觉听觉中直接感知下一步 [29][32] - 提出感知控制框架,感知信息实时介入控制指令,实现"Planning and control in perceptive frame" [33][34] - 基于香农采样定理探讨在采样不足时如何有效控制,为算力受限数据不完备场景提供思路 [35][36] 硬件基础设施与产业逻辑 - 禾赛创始人李一帆强调专注基础设施是支撑行业发展的关键,硬件开发存在质量性能成本的不可能三角 [38][39][42] - 降本关键是自己掌握关键部件并优化设计,而非压榨供应商,公司自2017年起每年投入数亿元自研核心技术 [45][46] - 在软硬不解耦环境下,中国创业者凭借强大供应链和制造能力有望快速抢占市场,这可能是未来20年最好的机会 [48][49] 具身智能的本质与模型构建 - 自变量机器人CEO王潜认为具身智能不是把大模型塞进机器人,也不是AI应用,而是平行于虚拟世界的物理世界基础模型 [50][52] - 物理世界基础模型需要端到端训练和统一模型应对多样任务,核心是数据为中心,强调高质量真实数据而非单纯增加数据量 [54][55][57] - 通才模型是未来通用机器人核心,可通过学习物理规律实现few-shot learning,真正人工智能基点是物理基点 [58] 圆桌讨论:第一性原理与软硬件协同 - 具身智能第一性原理尚未收敛,有观点提出"牛顿加辛顿"模型,结合物理规律约束与神经网络学习能力 [60][63][64] - 另一观点提出"三原论"智能闭环,由欲望(目标驱动)—先验(内在结构)—经验(现实反馈)共同组成 [65][66][72] - 软件需要硬件别太脆别太热别太容易坏,硬件认为AI越强对硬件要求越低,但当前AI不够强仍需高稳定性硬件 [82][84][86] - 软硬件关系是螺旋式迭代,未来关键在于实现软硬一体融合设计,而非谁先行 [88][90] 数据驱动与模型驱动路径 - 模型驱动方式可解释可控但覆盖面有限,数据驱动覆盖面更广且可能催生新理论,但需要"好数据"而非"多数据" [92][93] - 当前机器人研究学生更多转向数据驱动,因其成果更可见,智能自动化需机器能自己"挖数据矿"实现采集训练闭环 [95][96] - 纯粹依赖数据拟合动力学系统不现实,需结合物理规律如流体力学多体动力学,才能让具身智能具备稳健性 [100] 理想机器人形态与未来展望 - 理想机器人形态包括能踢足球进行综合考场训练,计划205年机器人足球队与人类世界杯冠军对抗 [102][103] - 其他理想形态包括拥有好奇心能自我制造,与人类完美共生实现绿色智能节能高效,以及最终实现AGI用于生产消费娱乐和星际探索 [105][108][109] - 当前是年轻人最幸运时代,有机会定义智能,再早无算力再晚市场已被占据 [110]