机器人模型

搜索文档
字节发了个机器人全能大模型,带队人李航
量子位· 2025-09-06 04:21
技术突破 - 字节推出Robix视觉-语言单模型 整合机器人推理 任务规划和自然语言交互三大功能 解决多模块拼接导致的信息代沟问题 [1][3][4] - 模型采用思维链推理技术 基于当前场景物体 空间关系和任务要求进行迭代决策 实现思考过程 动作指令和人类回复的逻辑循环整合 [10][12][13][14] - 通过三阶段训练策略:持续预训练阶段使用机器人数据学习3D空间和语言-画面对应 监督微调阶段模拟真实场景训练逻辑思维 强化学习阶段通过算法纠正决策偏差 [17][19] 性能表现 - 在8个空间理解任务中 Robix的7B和32B版本有7个任务表现优于Qwen2 5-VL 平均准确率更高 [21] - 在多数基准测试中超越闭源模型 包括GPT-4o和Gemini 2 5 Pro [21] - 离线评估中Robix-32B-RL在所有评估集上排名第一 [22] - 在线评估使用UMI设备时 Robix-32B在5个任务中的3个超越Gemini 2 5 Pro 平均任务进度更高且大幅超越Qwen2 5-VL-32B [23] - 使用GR-3进行自动化真实机器人评估时 Robix-32B平均任务进度达92 5% 分别比Gemini 2 5 Pro和GPT-4o高出4 3和28 1个百分点 [25] 行业影响 - 机器人模型发展方向从拼凑模块数量转向提升单一模型的综合能力 [27] - 项目由字节AI实验室负责人李航博士领导 其曾担任华为诺亚方舟实验室主任和首席科学家 2017年加入字节后主导机器人项目 [28][30]
宇树科技王兴兴最新发声,机器人目前最大的问题不是数据
DT新材料· 2025-08-09 16:05
行业现状与需求 - 2025年上半年机器人行业呈现爆发式增长,整机厂商和零部件厂商平均增长50%-100%,需求端成为主要驱动力 [2] - 人形机器人AI能力处于ChatGPT出现前1-3年的发展阶段,尚未达到技术临界点 [5] - 当前行业过度关注数据而忽视模型问题,现有机器人模型架构不够统一导致数据利用率低 [4] 技术发展趋势 - 未来2-5年技术重点将聚焦于:统一端到端智能机器人大模型、低成本高寿命硬件、超大批量制造、低成本大规模算力 [7] - 人形机器人ChatGPT时刻预计最快1-2年、最慢3-5年内实现 [6] - AI和机器人领域发展具有全球共创特性,创新伴随随机性和年轻人才贡献 [3] 市场前景预测 - 全行业人形机器人出货量有望实现每年翻番,重大技术突破可能带来2-3年内年出货量达数十万甚至上百万台 [11] - 公司从坚决反对转向布局人形机器人领域,直接原因是客户主动下单需求推动 [8] 产品战略方向 - 公司致力于开发通用型人形机器人,目标覆盖工厂、表演、家庭等多场景应用 [9] - 目前公司主要资源集中于训练机器人多场景工作能力 [9]
宇树科技王兴兴:机器人目前最大的问题在于模型问题
凤凰网· 2025-08-09 04:00
机器人行业现状 - 目前机器人行业对数据关注过多 对模型关注不足 [1] - 当前机器人模型架构不够好且不够统一 [1] - 即使有优质数据训练 模型问题导致无法有效利用 [1] 宇树科技观点 - 公司认为模型问题是行业最大瓶颈 [1]