机器人大讲堂
搜索文档
IJRR北邮首篇,联合三星中国研究院、清华大学等共同探讨“机器人操作大模型”
机器人大讲堂· 2025-11-24 08:31
通用机器人操作面临的挑战 - 在非结构化场景中实现通用操作存在挑战,包括与人类非自然交互、数据稀缺、感知和决策能力有限、处理不准确、策略不够鲁棒以及环境转移性差 [1] 基础模型为解决挑战带来的机遇 - 大型语言模型能直接生成策略代码或动作序列,促进机器人与环境的自然交互 [4] - 视觉基础模型增强机器人在开放环境下的感知能力 [4] - 视觉语言模型作为多模态信息理解的核心,促进视觉与语言的对齐 [4] - 大型多模态模型扩展模态范围至3D点云、触觉等更多感知维度 [4] - 视觉生成模型可根据文本或图像生成2D图像或3D网格,辅助仿真环境场景生成或环境转移 [4] - 机器人基础模型作为端到端策略模型,能基于输入观测直接输出动作 [4] 当前通用操作的发展路径与框架 - 在有限条件下利用单一基础模型实现通用操作不足,当前机器人基础模型端到端训练方法保证99%以上成功率仍是挑战 [6] - 参考自动驾驶发展路径,初期通用操作需要一个框架,并将L0级别通用操作限定在提升旧技能、操作刚性物体、静态环境、短程任务及低力/位精度要求 [6] - 通过提升各模块性能可实现从L0级别到最终统一操作 [6] 基础模型在交互模块的应用 - 基础模型相比传统固定模板方法,在处理含糊和纠正指令时具备自然语言交流、多模态感知检测歧义及强大先验知识理解用户意图的优势 [8] 基础模型在前后置条件检测模块的应用 - 基础模型在物体可供性检测和识别中具备开放集零样本识别、加速学习过程及帮助选择更精确操作姿态的优势 [10] 基础模型在技能层级模块的应用 - 基础模型能辅助处理自然语言输入,并通过世界知识和常识推理提升感知与推理水平,增强技能层次任务可扩展性和泛化能力 [12] 基础模型在状态感知模块的应用 - 基础模型可辅助生成带语义信息的场景重建,利用强大二维特征提升三维特征质量,并使开放集姿态估计成为可能 [14] 基础模型在策略模块的应用 - 策略分为基于物体/动作方法和端到端方法,基础模型推动策略发展为通用目标策略,分类为视觉-语言-动作-代码、视觉-语言-动作-关键位姿和视觉-语言-动作-密集位姿 [16] - 基础模型助力强化学习应对奖励函数设计、任务分层及探索效率等挑战 [17] 基础模型在操作数据生成模块的应用 - 操作数据分为真机、仿真和互联网数据,基础模型能实现仿真场景布置和3D资产自动化生成及逼真数据增强 [21] - 真机数据采集趋向低成本遥操作设备发展,例如Human Plus成本仅30美元(一个RGB相机),而Open-Tele Vision成本达3499美元 [21]
TOP50榜单申报!寻找定义中国机器人“领军力量”与具身智能“变革新星”
机器人大讲堂· 2025-11-24 00:00
文章核心观点 - 2025年中国机器人产业处于从“并跑”迈向“领跑”的关键跃迁期,行业进入“从多到强”的深耕期,呈现出成熟市场“深水区竞争”与前沿技术“爆发前夜”的二元结构特征 [1][4][5] - LeadeRobot发布年度双榜单旨在系统性梳理产业核心力量,其中“领军企业榜TOP50”定位为产业的“定盘星”与“牵引力”,“具身智能时代新星榜TOP50”定位为未来的“风向标”与“创新引擎” [3][7][8][11] - 榜单评选不仅记录行业现状,更试图引导资源流向和定义未来方向,为资本与市场识别拥有强大团队、核心技术、可迭代产品及可持续商业模式的企业提供重要参考 [5][6][13] 行业阶段与特征 - 中国机器人产业已走过“从无到有”的引入期和“从有到多”的扩张期,当前正进入“从多到强”的深耕期 [4] - 成熟市场呈现“深水区竞争”特征,工业机器人及部分服务机器人领域从增量竞争转向存量与增量并行格局,技术出现趋同化,价格战此起彼伏 [5] - 前沿技术领域处于“爆发前夜”,以人形机器人和具身智能为代表的新赛道正处技术突破与商业化探索胶着期,潜力与不确定性并存 [5] 领军企业榜定位与价值 - 榜单旨在甄别已穿越初期不确定性、建立起系统性优势的行业巨头,扮演产业“压舱石”角色 [8] - “领军”含义超越规模,涵盖技术引领者(投入底层技术、核心算法原始创新)、市场定义者(产品标准成为行业事实标准)、生态构建者(带动产业链协同发展)及商业模式标杆(验证可持续盈利路径) [9] - 入选意味着行业领导地位获权威背书,是企业争取高端客户、吸引顶尖人才、获得政府支持与资本市场青睐的“实力证明” [10] 具身智能新星榜定位与价值 - 榜单聚焦决定产业未来十年格局的变革性力量,关注在融合感知、认知、决策和行动的“具身智能”领域展现出颠覆性潜力的企业 [11] - “新星”关键特质在于成长性,包括技术前瞻性与独特性、场景定义创新能力、卓越团队执行力及商业潜力可验证性 [12][13] - 入选是一次强大的“信用赋能”和“曝光赋能”,帮助企业脱颖而出,进入顶级投资机构、产业资本和战略合作者视野 [13] 涉及企业范畴 - 榜单评选覆盖工业机器人、服务与特种机器人、医疗机器人、人形机器人、具身智能企业及核心零部件企业等多维度产业生态 [19][20][21][22][23][24][25][26]
2位华人学霸造的家务机器人火了!14万带回家,手把手教它干活,要解放你的周末
机器人大讲堂· 2025-11-23 06:47
产品核心特点与性能 - 机器人Memo由斯坦福华人博士团队打造,历经18个月隐身模式后发布,具备处理家务能力,如收拾餐桌、清洗碗碟、折叠衣物和冲泡咖啡[2][3] - 在无遥控无剪辑演示中,Memo能准确识别并拿起易碎玻璃杯,将散落餐具归位洗碗机,处理不同材质袜子并叠整齐放入抽屉[7] - 机器人身高1.7米,体重约77公斤,配备轮式移动底盘,水平臂展0.8米,升降柱垂直可达2.1米,全身包裹柔软硅胶外壳,边角圆润,无外露螺丝[9][10] 技术创新与数据训练 - 公司采用独特的技能捕捉手套进行训练,手套与Memo手部有相同几何结构和传感器,人类佩戴手套做出动作,机器人即可学习,每套系统成本约400美元[11][14][15] - 为解决人手与机械手差异,公司开发技能转换技术,系统成功率高达90%,目前已收集近1000万条轨迹数据[17][18] - ACT-1是公司为Memo打造的端到端基础模型,首次将长时程操作与基于地图的导航结合,输入像素即可输出全身动作指令[19][21] 实际应用与泛化能力 - 在演示中,Memo能自主行走近40米距离,与21件不同物体进行33种操作,总计68次精细交互,如完成从餐桌到洗碗机的任务[22] - ACT-1模型具备强泛化能力,在多个陌生Airbnb房源中,通过解读3D环境地图,能自主规划路线并找到关键位置完成任务[24] - 机器人掌握了高精度灵巧技能,如从杂乱袜子中挑出单个并卷成球状,以毫米级精度完成咖啡压粉动作,在20多次演示中未搞砸放置酒杯任务[26][27] 团队背景与发展规划 - 创始团队由赵子豪(CEO)和迟宬(CTO)组成,二人均为斯坦福博士,拥有在Google DeepMind、Tesla Autopilot等顶尖实验室的工作经验[30][32][36] - Sunday Robotics团队目前已扩展至约30人,横跨软件、硬件、数据、训练与模型评估等完整技术栈[30] - Memo目前处于测试阶段,预计2026年正式推出,原型机成本在6000到20000美元之间,计划未来将成本降低至少50%[40]
全球首个!这个机器人100%可食用,连电池都能吃 | Advanced Science
机器人大讲堂· 2025-11-23 06:47
可食用机器人技术突破 - 瑞士洛桑联邦理工学院(EPFL)研究人员开发出首个完全可食用的软体机器人,每个部件包括电池和驱动器都100%可食用[3][4][7] - 机器人电池采用明胶和蜡制成,内部使用液态柠檬酸和小苏打等食品级材料,通过化学反应产生二氧化碳气体驱动[9] - 可食用阀门基于"snap-buckling"原理工作,机器人每分钟可弯曲4次左右,电池能维持几分钟工作时间[12][13][15] 核心技术创新点 - 解决了传统可食用机器人电机和电池不能食用的难题,开发出可食用版本的气动电池和阀门系统[5][6][7] - 驱动器在稍硬底座上设置相互连接的气室,加压时会弯曲,产生的二氧化碳通过明胶管道进入驱动器[11] - 气动电池和阀门系统是与各种可生物降解气动机器人兼容的关键使能技术[24] 潜在应用场景 - 主要应用方向是为难以接近的野生动物提供营养或药物,如通过模拟运动特征吸引野猪投喂疫苗[17][20] - 通过调整机器人大小、运动特征和味道,可针对几乎所有喜欢扭动物体的动物进行定向投药[21] - 未来可能应用于野外大规模机器人集群,具有简单性、可负担性和环境友好性特点[24] 商业化前景 - 该研究是欧盟资助RoboFood项目的一部分,研究人员正在开发其他可食用机器人[25] - 可食用弹性动力源可能成为美味小型跳跃机器人的关键,具备直接从甜点盘跳进嘴巴的潜力[25] - 驱动器含有甘油带有甜味口感像软糖,气动电池外脆内酸类似柠檬糖,已制作石榴糖浆调味版本并进行消费者体验分析[22][24]
深度解读|从赛场到市场:中关村具身智能机器人应用大赛解码产业变革新路径
机器人大讲堂· 2025-11-23 00:00
赛事概况与产业意义 - 第二届中关村具身智能机器人应用大赛是行业从“实验室样机”迈向“产业级应用”的里程碑事件,汇聚全球157支顶尖战队[1] - 赛事以“具身引智、应用未来”为主题,紧扣“劳动最光荣”核心导向,通过家庭服务、工业制造、安全处置等多元场景实战竞技[1] - “具身智能”首次写入政府工作报告,并被列为“人工智能+”行动中新质生产力的核心引擎[3] 赛事迭代与赛道设计 - 赛事从首届的技术展示转向“真实场景劳动技能比拼”,设置三大核心赛道:具身智能模型能力挑战赛、具身智能场景应用赛、具身智能学术前沿与产业生态[4][6] - 场景应用赛覆盖工业制造、商用服务、居家服务等6大场景15项任务,复刻真实作业环境,精准击中产业痛点[6][8] - 赛事吸引157支国内外战队,近百支队伍晋级决赛,形成高校院所与企业多元创新主体同台竞技格局[10] 标杆企业技术表现 - 灵御智能TeleAvatar机器人在家庭服务、工业制造、安全处置场景斩获一等奖,物料搬运任务43秒完成,零件装配用时1分22秒,远超赛事均值标准[11][14] - 灵心巧手“灵心乐府机器人乐队”用Linker Hand灵巧手弹奏《青花瓷》,指尖灵活度堪比真人[16] - 千寻智能“墨子”机器人1分钟内完成“穿一串糖葫芦”全流程,智身科技四足机器人“钢镚”具备720度后空翻和40度爬坡能力[16][18] 学术前沿与技术突破 - 北京理工大学多模态脊柱型四足机器鼠SQuRo-S获学术前沿赛一等奖,能跨越1.07倍身体高度障碍物和0.86倍身体宽度狭窄空间[19] - 技术突破围绕“精准控制、多模态融合、场景适配”三大核心维度展开,实现从“会动”到“会干活”的跨越[27][28][32] - 清华大学自动化系团队通过端到端深度强化学习框架,实现机器人毫秒级实时响应,克服传统预设策略的动作迟滞问题[30] 评审机制与产业生态 - 大赛创新设置现场演示与功能认证环节,采用“以实绩说话”的评审机制,连接技术创新与产业需求[22][24] - 总计200万元奖金池支持研发,获奖团队落地海淀可优先享受基金对接、人才服务等配套政策,接入区域内264家具身智能企业构成的产业网络[26] - 赛事形成竞技+孵化+转化模式,成为产业创新“加速器”,推动技术从实验室到生产环境的转化[24][26] 技术路线与场景适配 - 产业呈现“通用性平台+专业化方案”双轨并行发展路径,平衡技术创新与市场需求[35][37] - 工业场景强调效率与精度,家庭服务注重安全性、柔和度与交互友好性,安全处置突出可靠性与环境适应性[35] - 多模态融合技术整合视觉、触觉、语言等感知维度,让机器人从“感知”环境向“理解”环境跨越,为自主决策提供基础[32][34] 产业前景与发展路径 - 中国具身智能产业进入“规模化落地”关键阶段,正从“跟跑”向“并跑”“领跑”跨越[38] - 以国家战略为指引,以地方政策为支撑,以赛事平台为桥梁,探索具有中国特色的具身智能发展路径[38][40] - 智能机器人以“新工友”身份重塑劳动形态,从工业精密装配到家庭日常琐事,推动生产关系变革[38]
地瓜机器人揭晓具身智能机器人大算力开发平台S600,傅利叶、加速进化等成首批战略客户
机器人大讲堂· 2025-11-22 09:47
公司战略与产品发布 - 公司以“无FUN不起浪”为主题在深圳成功举办DDC2025地瓜机器人开发者大会,宣布全链路开发基础设施全新升级[1] - 公司前瞻揭晓具身智能机器人大算力开发平台S600,并宣布将于2026年第一季度正式发布[1] - 公司全新推出覆盖数据闭环系统、具身智能训练场、Agent开发服务的“地瓜机器人一站式开发平台”,以软硬结合、端云一体加速机器人智能进化[1] - 公司宣布傅利叶、加速进化、自变量机器人、星动纪元、北京人形机器人创新中心等成为S600全球首批战略客户[1] - 公司宣布知行科技、天准星智、华勤技术、立讯精密等汽车产业Tier1成为S600生态首批合作伙伴,将共同打造机器人控制器[3] - 公司CEO表示具身智能将成为驱动产业变革的全新生产力,公司致力于以全链路开发基础设施帮助客户和开发者筑牢底座[5] 技术平台与产品性能 - 公司以软硬结合、端云一体的全链路开发基础设施,全方位助力机器人规模化落地[5] - 公司面向端侧打造覆盖各算力段的旭日和RDK双系列产品矩阵,面向云侧打造一站式开发平台[5] - S600拥有560 TOPS(INT8)算力,采用大小脑架构设计,大脑配置18核A78AE CPU和全新BPU Nash,可支持多种具身大模型算法端侧部署[8] - S600在适配Pi0和Qwen2.5-VL-7B时性能分别超越主流具身大脑平台2.3倍和2.2倍[8] - S600小脑配置6核R52+ MCU,专为人形机器人优化,具备高可靠、实时的运动控制能力[8] - 一站式开发平台提供数据闭环系统、具身智能训练场、Agent开发服务三大服务[12] - 数据闭环系统提供高质高效的数据生成和标注,以模型训练-仿真评测-硬件在环三位一体驱动机器人自主进化[12] - 具身智能训练场聚焦全场景、全形态、全任务,提供从基础设施到应用的全链路支持[18] - Agent开发服务支持打造辅助机器人开发的各类Agent,RDK Agent开发助手可实现一句话完成机器人应用开发与部署[18] 算法创新与性能 - 公司自研的双目算法SOTA指标行业领先,双目Depth精度媲美激光雷达,避障性能达到智能驾驶级别[15] - 公司推出业界首个多双目全景Occupancy感知方案高阶段Omni-OCC方案[15] - 公司自研的VO-DP纯视觉Manipulation抓取方案性能超行业SOTA,成功率超越DP和DP3,泛化性和鲁棒性远超Pi0.5,达到工业场景应用要求[15] 商业与生态成果 - 公司商业成果量质齐飞,出货量同比增长180%,客户数量同比增长200%[22] - 公司先后助力云鲸逍遥002开创扫地机AI双目感知时代,助力影石Insta360打造全球首款全景无人机,助力维他动力发布智能伴随机器狗[22] - 公司RDK生态横向遍布亚太、欧洲和北美20多个国家,纵向覆盖全年龄段,迄今已服务超10万机器人开发者,较去年同比增长100%[25] - 公司全球生态创新项目DGP地心引力计划已赋能500+中小创新团队实现项目落地,较去年同比增长150%[25] - 公司携手点猫科技、阿里云等国内产学研伙伴,赋能超500+海内外大中小院校,较去年同比增长150%[27] - 公司携手Ultralytics YOLO、ROS、LeRobot等全球开源伙伴,共建开放共享的具身机器人创新策源地[27] - 公司正式启动“地瓜青年学者计划”,重点资助科研领域优秀青年学者开展具身智能核心技术攻关[27] - 本次开发者大会吸引超1000名机器人开发者报名参与[29]
2025年头部企业累计订单超24亿,订单已破2万台,T链确定性或没国产人形高
机器人大讲堂· 2025-11-22 09:47
美国供应链动态与特斯拉目标调整 - 特斯拉已决定停止与中国供应商合作生产其在美国制造的汽车,并替换部分中国制造的零部件[1] - 特斯拉将其人形机器人Optimus的年产目标从5000台下调至2000台[1] - 美国供应链脱钩策略被证明不切实际,例如纯美国供应链制造的K-ScaleLabs成立仅18个月就宣布倒闭[1] 中国人形机器人行业订单与交付进展 - 行业已进入拼大单阶段,截至目前已有8家企业官宣斩获超亿元或千台以上订单,2025年头部企业累计订单额高达24亿元[3] - 在订单刺激下,部分国内头部企业2025年销售规划在千台量级,预计2026至2027年达到上万台的出货量目标[3] - 部分C端销售页面标注预计交付时间,如“预计2026年5月有货”、“首批2026年3月开始交付”[3] - 智元机器人最大金额订单来自中国移动,金额达7800万元共约200台,另获具身智能训练场建设订单7000万元,以及富临精工数千万元近百台订单和龙旗科技数亿元框架订单,预计2025年目标出货量达3000-5000台[6] - 优必选Walker系列人形机器人累计订单金额已突破8亿元,包括近亿元全球最大单笔订单、2.5亿元采购合同、超3200万元合同及1.26亿元项目,预计2025年交付约500台[8] - 加速进化公司2025年上半年交付数百台,截至11月出货量已超700台,2026年产能有望提升至数万台[8] - 乐聚获得上亿元订单,包括8000万元北京石景山项目,全年交付量预计达千台级[9] - 越疆机器人获瑞德丰精密8050万元合同,蓝思科技承诺2025年采购1000台[9] - 星动纪元总订单额破5亿元,物流行业最大单笔订单近五千万元[11] - 傅利叶智能已交付百余台人形机器人[11] - 星尘智能与仙工智能达成千台级订单战略合作,并与金马游乐计划两年内向文旅场景提供千台级产品[11] - 智平方与惠科股份计划未来三年内部署超1000台机器人[11] - 众擎机器人未来3年将交付不少于2000台具身智能机器人[13] - 逐际动力多形态双足机器人获批量订单,全尺寸人形机器人完成量产准备[13] - 京东物流宣布未来5年采购300万台机器人、100万台无人车和10万架无人机[13] - 中信建投研报认为2025年为人形机器人量产元年,全年行业出货量在万台量级[14] 产品价格趋势与成本控制 - 宇树科技G1售价9.9万元,Unitree R1售价仅3.99万元,打破高端机器人数十万定价惯例[15] - 加速进化公司发布BoosterK1,首批100台价格降至2.99万元[17] - 松延动力发布售价仅9998元的“小布米”,上架一小时订单破100台,两天内首批500台售罄,上半年已获超2000台商业化订单,合同总额破1亿元[17] - 通过核心部件高度自研、提高国产化率及使用复合材料实现成本控制[19] - 中信建投认为未来人形机器人整机成本可能在8万元左右甚至更低[19] - 有专家预测今年会有企业把全尺寸人形机器人价格降到五万元区间[20] - 到2030年工业场景需求量预计达326.3万台,家庭与商用场景达59.3万台,市场规模有望达上千亿元[23] 应用场景与市场路径 - 数采中心、商场导购、酒店服务等商用场景成为首选试验田,完成验证后向工业制造领域纵深发展[13] - 更现实的路径是先聚焦于单一或有限的核心功能,如儿童教育娱乐、老年陪伴或家庭安防[22] - 厂商需在成本、性能、可靠性和实用性之间找到平衡点,竞争关键从价格转向价值[23]
2025智能机器人大赛初赛集结号!解锁技术竞技与产业落地双重机遇
机器人大讲堂· 2025-11-22 04:00
大赛概况 - 2025智能机器人大赛初赛将于11月27日在北京启动,主题为“智领科技、创新未来” [1] - 大赛已邀请100余支团队参与180个任务项角逐,旨在展现创新成果、推动产业对接合作 [1] - 赛事设立制造业类、康复养老类、安全应急类、创新类四大赛道,并首创“自主设计场景”模式,打破传统“命题式”赛制 [1] 评审机制 - 初赛采用分区分组、集中线下评审模式,评审专家由行业知名专家及企业技术负责人组成 [3] - 评审标准聚焦技术创新性、产品引领性和推广应用潜力,旨在遴选“种子选手” [3] 参赛企业名录 - 工业机器人领域涉及埃斯顿自动化、埃夫特机器人、非夕科技、法奥机器人、越疆机器人等15家企业 [8] - 服务与特种机器人领域包括亿嘉和、晶品特装、七腾机器人、史河机器人、九号机器人等9家企业 [9] - 医疗机器人企业涵盖元化智能、天智航、思哲睿智能医疗、精锋医疗、佗道医疗等12家企业 [10] - 人形机器人企业包括优必选科技、宇树、云深处、星动纪元、伟景机器人等28家企业 [11] - 具身智能企业涉及跨维智能、银河通用、千寻智能、灵心巧手、睿尔曼智能等23家企业 [13] - 核心零部件企业包括绿的谐波、因时机器人、坤维科技、脉塔智能、青瞳视觉等26家企业 [14] - 教育机器人企业有硅步机器人、史河科教机器人、大然机器人3家 [14]
人形机器人路在何方?顶刊重磅综述,北航、国创中心、浙大等全景解析人形机器人技术现状与趋势
机器人大讲堂· 2025-11-21 10:06
文章核心观点 - 人形机器人技术正处于快速发展的爆发期,大模型与高性能计算平台的深度融合正推动其从“硬件系统”演变为“软件赋能的具身智能体”[7] - 全球人形机器人产业格局呈现“国际基础扎实,AI赋能”与“国内需求导向,百花齐放”的双轨发展模式,国内企业在运动控制等关键技术领域已实现与国际“并跑”[9][10][11] - 人形机器人是具身智能的理想载体,其技术体系复杂,涵盖本体设计、核心零部件、环境感知、运动控制、具身智能及人机交互等六大关键模块,未来发展面临软硬件协同、感知融合、智能泛化等核心挑战[14][43][46] 人形机器人发展历程与现状 - 技术演进划分为四个阶段:早期发展(1969-2000)、高度集成发展(2000-2015)、高动态运动与智能化发展(2015-2022)、快速发展的爆发期(2022年至今)[7] - 国际产业由美国、日本和欧洲引领,科技公司如Tesla、Figure AI与AI巨头OpenAI、NVIDIA共同推动技术迭代,知名学府提供基础理论支持[9] - 国内产业起步较晚但创新型企业众多,形成企业与高校并行的“双轨制”发展模式,政策支持精准,在运动控制算法、具身大模型等关键技术开源程度较高[10][11] - 国内代表性产品密集发布,例如优必选Walker S1(41个自由度,76 kg)、傅利叶GR-2(53个自由度,63 kg)、智元远征A2(40余个主动自由度,时速7 km)等,凸显“百花齐放”景象[11][13] 人形机器人关键核心技术 - **本体与核心零部件**:本体设计面临高强度、紧凑、灵活和轻量化挑战,采用碳纤维复合材料等实现平衡,如Tesla Optimus总重控制在57kg以内;核心零部件包括谐波减速器、伺服电机、高性能控制器和仿人灵巧手,其技术挑战集中在材料耐久性、热管理、计算能力和操作稳定性[17][21] - **高精度环境感知与场景理解**:依赖传统传感器(视觉、力觉等)和新型传感器(视触觉、电子皮肤等),核心挑战在于多模态信息融合,当前决策延迟在200~300 ms,而达到人类操作水平需低于100 ms[24] - **运动控制与平衡**:包括双足步态控制、上肢灵巧操作和全身协调运动三大模块,研究重点从稳定性转向全身协调运动与上肢操作的交互优化,通过多模态感知技术实现动态平衡下的复杂任务[25][28] - **具身智能与大模型**:定义为智能体通过物理形态与环境互动来感知、决策和执行的能力,发展路径包括通用大模型(如Google的PaLM-E)和垂直大模型(如字节跳动的GR-2模型),全球协作项目如DeepMind的RT-X和NVIDIA的Project GR00T推动技术落地[27][31][32] - **人机协同与共融交互**:关键技术包括柔顺控制、动作与意图交互、情感共融,情感理解是实现“人本智造”以人为本的核心需求[33][36] - **操作系统与工具链**:操作系统需具备数据互联、分布式协同等特征,生态繁荣度是未来核心竞争力;仿真平台如NVIDIA Isaac Sim支持大规模虚拟训练,虚实融合是新发展趋势[36][37] 人形机器人典型应用 - **特殊服役环境**:在国防军工、应急救援等场景具备类人结构和高自由度运动优势,能执行其他机器人难以完成的任务[39] - **智能制造**:在汽车制造领域展现灵活移动性和对产线变化的适应能力,例如优必选机器人与东风柳汽、吉利汽车合作,宇树科技机器人在蔚来汽车工厂进行自动拣料配送[40] - **民生服务**:在家庭服务、社会服务、医疗健康和教育培训等领域有巨大潜力,但当前应用多为示范性验证,面临续航、操作精度和高成本等挑战[42] 人形机器人挑战与难点 - 整机软硬件需加强协同化创新设计,早期需统筹机-驱-控-算的指标分配与实时性约束[43] - 复杂任务尚需高精度环境感知与多模态融合,现有传感难以全面覆盖复杂环境变量[43] - 强思维链高泛化性具身智能仍处在起步阶段,大模型对底层控制的直接介入有限,动态环境建模能力待增强[43] - 动力系统的驱动高效性与续航持久性未达需求,电池能量密度与充电效率是限制因素[45] - 标准规范与安全保障体系亟需加强,需完备技术、性能、安全测试标准[45] 人形机器人未来发展趋势 - 具身智能与通用人工智能深度融合,从大语言模型交互向视觉-语言-动作模型为主的多模态交互过渡[46] - 端到端多模态大模型提升自主操作技能,通用与垂直大模型两种发展路线并行迭代[46] - 大规模仿真训练平台助力高效迭代,虚实融合仿真成为新趋势[46] - 算力算法升级推动技术快速融合创新,新一代通信技术、云-边计算、新能源等技术将与人形机器人深度融合[46] - 人机环共融与安全伦理逐步规范,构建人机智融新范式[47]
一台人形机器人106.286公里的“流浪计划”,与它无法走入的白天
机器人大讲堂· 2025-11-21 10:06
文章核心观点 - 智元机器人公司的“远征A2”人形机器人完成了全球首次跨省行走,全程106.286公里,无关机、零摔倒,创下吉尼斯世界纪录 [1] - 此次挑战并非实验室原型测试,而是使用无改装量产机完成,证明了产品已具备稳定可靠的基线能力,是人形机器人从实验室走向商业应用的“公开成人礼” [3][4] - 挑战暴露了当前技术瓶颈与基础设施缺失,但同时也标志着人形机器人“身体”已初步成熟,商业化落地的临界点已至 [6][17][22] 技术能力与测试验证 - 机器人成功应对了106.286公里的复杂路面,包括柏油路、砖石地、砂石路,并在低温环境中稳定运行,展示了其可靠性和强壮程度 [1][3] - 公司的技术底气源于3500小时的真机高强度测试,覆盖全场景,通过“暴力测试”哲学提前暴露并解决小故障和耗材问题 [6] - 挑战采用“半自主”模式是出于现实考量,因机器人缺乏明确路权和社会接受度,技术上的全自主能力已基本成熟可行 [8][9] 当前挑战与技术瓶颈 - 电池是核心瓶颈,机器人站立续航约3小时,行走续航约2小时,最终历经56小时、15次换电才完成挑战 [12][13] - 为室内场景设计的机器人需加装GPS等“室外感知的眼睛”以拓展应用边界,而“走台阶”等动作仍是商用级挑战 [16] - 社会基础设施缺失是重大挑战,例如缺乏机器人专用补给点、合法停靠点以及明确的交通规则,挑战被限制在夜间进行 [9][11] 商业化应用与市场前景 - 挑战的核心价值在于将可靠性从抽象参数变为可感知的事实,建立用户心智,让客户敢于高频使用 [17] - 当前商用落地聚焦三大场景:泛语言工作(如展厅接待、讲解)、文娱表演以及制造工厂 [19] - 未来应用场景将向多极拓展,包括一两年内有望实现的自主买菜,以及煤矿、消防等特种作业 [19] 行业展望与公司目标 - 在全球经济增长乏力背景下,机器人与具身智能赛道被视作能提振信心、拥有巨大想象空间的领域 [20] - 公司对行业融资热潮保持冷静,秉持“共同把蛋糕做大”的心态,认为探索出成功的商业模式对整个行业有利 [20][22] - 公司为2026年设定了两个清晰技术目标:实现“准零维护”(机器人能自己换电充电)和突破“作业能力”(提升完成任务的成功率与泛化性) [22]