外骨骼遥操作方案
搜索文档
从麻将博弈到智能配送!灵初智能WAIC 2025展示具身智能长程、灵巧多场景应用
钛媒体APP· 2025-07-29 14:03
核心观点 - 公司在WAIC 2025展会上展示了其具身智能技术在长程复杂任务、开放场景操作及通用泛化性抓取等关键挑战上的突破 [2] - 公司通过自研的分层端到端VLA模型与强化学习算法体系驱动五大应用场景,体现了从简单动作执行向认知决策和长程操作的关键跃迁 [2][18] - 公司构建了由数据金字塔、VLA模型、硬件整机和全场景落地验证组成的四大支柱技术生态,旨在提供可规模化的具身智能解决方案 [18] 技术能力与模型 - 自研的分层端到端VLA模型与强化学习算法体系为技术演示提供核心驱动支撑 [2] - Psi R1模型首次实现30分钟连续麻将博弈,展现了在开放环境下处理复杂任务的突破性能力 [18] - 基于CoAT框架的VLA模型上层负责理解任务并规划顺序,下层强化学习控制器负责执行动作细节 [6][18] 展示场景与性能 - **麻将机器人**:能在开放环境下完成30分钟以上连续麻将对局,具备毫米级精度操作和实时博弈决策能力,动态构建决策链 [4][6] - **自主打包任务**:仅接收自然语言指令即可自主分析商品排列、确定操作顺序、完成扫码与装袋,支持商品级泛化无需人工干预 [6][8] - **物流配送机器人**:配备7自由度机械臂和6自由度灵巧手,能处理3kg负载,解决“最后一百米”配送难题,精准识别并抓取多样化易变形物体 [8][10][12] - **21自由度灵巧手**:自研硬件,支持高精度动作控制与触觉反馈,具备精细力控与稳定执行能力,实现人手级轨迹精度与操作自由度 [13][15] - **遥操作与数据采集设备**:外骨骼遥操作方案配合3D触觉与力反馈系统,构建高质量数据闭环采集链条,为强化学习训练提供高效数据支撑 [15][16] 行业地位与发展阶段 - 公司已突破L2灵巧操作的行业分水岭,并在L3长程灵巧操作领域建立领先地位,领先于仍在L1泛化抓取阶段徘徊的行业水平 [18] - 作为国内具身智能科技领域的领军企业,公司核心团队来自顶尖高校AI实验室及头部科技企业 [19] - 公司推出了行业内首个分层端到端强化学习具身模型Psi系列,是行业内率先实现长程任务的具身模型研发企业 [19]
灵初智能WAIC 2025展示具身智能长程、灵巧多场景应用:从麻将博弈到智能配送
IPO早知道· 2025-07-27 10:59
公司核心技术展示 - 公司在WAIC 2025展会上展示了分层端到端VLA模型与强化学习算法体系驱动的多项具身智能技术产品,覆盖零售物流、泛工业、展示娱乐等多个领域[2] - 公司构建了完整的技术链条,包括数据、模型算法、硬件到场景应用的全流程能力[2] - 展示的场景Demo均源于真实客户需求与落地任务验证,解决了长程复杂任务、开放场景操作、通用泛化性抓取等具身智能落地关键挑战[2] 麻将机器人应用 - 麻将机器人可在开放环境下完成30分钟以上的连续麻将对局,实现毫米级精度的摸牌、放置、碰杠等复杂操作[3] - 机器人具备策略思考能力,能动态构建决策链并自主完成碰杠等博弈决策[3] - 该应用展示了视觉、语言与动作信息的融合能力,实现了"会思考的手"的概念[3] 自主打包任务应用 - 零售打包演示中,机器人仅需自然语言指令即可自主完成商品排列分析、操作顺序确定、扫码与装袋等全套动作[4] - 采用VLA模型分层架构:上层大模型负责任务理解与规划,下层强化学习控制器执行动作细节[4] - 系统支持商品级泛化与实时调整,无需人工干预或逐一标注[4] 物流配送应用 - 外卖配送机器人解决了"最后一百米"配送难题,能处理快递袋、纸袋等多样化、易变形物体[6] - 机器人可精准识别不同形态与摆放姿态,灵巧手能如人手般灵活穿过提环并稳固握紧[6] - 配备7自由度机械臂和6自由度灵巧手,可处理3kg负载的配送任务,实现端到端自动化操作[7] 硬件技术突破 - 自研21个自由度灵巧手展示了出色的操作灵巧性、运动协同性和执行高效性[9] - 灵巧手支持高精度动作控制与触觉反馈,具备单指、全手、多指组合等多类操作的精细力控能力[9] - 实现了人手级的轨迹精度与操作自由度,动作连贯性与互动性高度拟人化[9] 数据采集系统 - 推出外骨骼遥操作方案,可精确解构人手运动,观众可体验佩戴手套控制机械手每个关节动作[11] - 配合3D触觉与力反馈系统,构建高质量数据闭环采集链条,为强化学习训练提供高效数据支撑[11] 行业地位与技术生态 - 公司已突破L2灵巧操作行业分水岭,在L3长程灵巧操作领域建立领先地位[13] - Psi R1模型首次实现30分钟连续麻将博弈,标志具身智能从简单动作执行向认知决策和长程操作的关键跃迁[13] - 构建四大支柱技术生态:仿真+真实数据金字塔、CoAT框架VLA模型、极致稳定硬件整机、全场景落地验证及数据回环[13]