Workflow
Robotics
icon
搜索文档
教机器人“做人”:广东举办了一场机器人的“教练大赛”
21世纪经济报道· 2025-12-13 12:12
文章核心观点 - 广东省通过举办人工智能与机器人技能大赛,聚焦机器人“训练师”这一新兴角色,旨在解决机器人产业,特别是人形机器人产业化应用的核心痛点:缺乏大量真实场景训练导致能力不足、泛化性差 [1][2] - 行业正从依赖通用大模型数据转向在多元真实场景中进行具身智能训练,以提升机器人的准确性、稳定性和泛化能力,而“训练师”是完成数据采集、算法适配和实现“从离身向具身智能跨越”的关键 [2][4] - 为解决场景和数据问题,广东省创新性地提出并建设“1+1+N”具身智能训练场体系,通过统筹资源、构建生态,旨在加速高质量数据集规模化,推动机器人训练模式创新和产业智能化升级 [8][9] 行业现状与核心挑战 - 当前机器人,尤其是人形机器人的能力尚不足以满足产业化需求,具身智能的进阶速度远落后于大语言模型,核心原因在于缺乏大量真实场景训练 [2] - 行业内许多产品缺乏后半段真实场景训练,数据仍依赖通用大模型,导致机器人无法完全自主应对开放环境及封闭环境中的柔性化需求 [2] - 提升机器人“泛化能力”需要训练师人为“制造变量”,同一动作因物体大小、站位、幅度等不同需反复训练,导致数据需求量发生量级飞跃 [4] - 行业当前核心挑战之一是将人类经验转化为机器人策略,训练师不仅要教“人类如何做”,更要探索“机器人最适合怎么做”,并对学习算法进行适配性调整 [5] 解决方案与创新实践 - 举办训练师技能大赛,通过搭建高度贴合实际工作的环境,考核数据处理、系统搭建、交互设计等环节,引导参赛者提出解决方案,以加速AI技术在传统产业中的渗透和应用 [2] - 企业正探索多种数据采集技术路线,包括遥控操作、AI模型合成数据、视频观看姿态捕捉,而训练师的出现解决了数据获取“从0到1”的问题 [4] - 部分企业如帕西尼感知科技通过自研多维触觉采集设备PMEC和空间视觉矩阵,建设全球最大的具身智能数据采集工厂Super EID Factory,采集包含触觉、视觉、关节角度等全模态数据 [5] - 建设多单位融合的公共训练场平台,可避免企业重复投入,解决行业共性场景训练问题,例如柔性包装产线等通用场景,并能吸引产业链上下游企业聚集形成“10分钟创新圈” [8] 广东省产业布局与战略 - 广东省重磅发布具身智能训练场“1+1+N”体系,包括1个核心枢纽(广东省具身智能训练场)、1个示范窗口(深圳具身智能示范区)以及N个地市、行业细分领域的分训练场 [8] - 该体系旨在发挥各地政府和各类市场主体力量建设训练场,并通过合作机制统筹省内训练资源、数据的联动和融通,以加快高质量数据集规模化,优化资源配置,以数据驱动和异构训练加快迈向通用智能进程 [9] - 真实的工业场景对机器人稳定性要求更高、容错率要求更低,因此训练场既需要更多元场景,也需要更稳定的生态 [9] - 这种“全省一盘棋”的做法希望通过统筹资源发挥协同效应,既赋能具身智能产业,又助力做强做优做大地方优势产业 [9]
人形机器人细分龙头年内涨超300% 梳理产业链成本占比居前A股名单
新浪财经· 2025-12-13 11:53
行业趋势与市场表现 - 2025年人形机器人产业量产加速,智元等企业实现千台级交付,核心部件国产化率大幅提升,国内外政策持续支持,板块热度与商业化进程同步推进 [1] - 中信证券研报表示,人形机器人的产业趋势将继续为板块提供业绩和估值的双重驱动 [1] - 二级市场方面,斯菱股份年初迄今股价累计最大涨幅为329%,昊志机电年初迄今股价累计最大涨幅为134% [1] 产业链成本结构与相关上市公司 - 在人形机器人旋转关节领域,各核心部件成本占比及涉及的A股上市公司如下 [2] - 驱动器成本占比为1%,涉及三花智控、拓普集团、蓝思科技和长盈精密 [2] - 无框力矩电机成本占比为4%,涉及步科股份、昊志机电、雷赛智能和卧龙电驱 [2] - 谐波减速器成本占比为5%,涉及绿的谐波、汉宇集团、斯菱股份和丰立智能 [2] - 编码器成本占比为2.7%,涉及汇川技术、奥普光电、禾川科技和开特股份 [2] - 轴承成本占比为1.2%,涉及力星股份、南方精工、国机精工和五洲新春 [2] 核心部件公司业务进展 无框力矩电机相关公司 - 步科股份为无框力矩电机国内龙头,已推出第四代产品可对标国际领先产品,2024年无框力矩电机销量约2.4万台 [5] - 昊志机电的谐波减速器、无框力矩电机等产品可应用于人形机器人,其机器人业务打造第二增长曲线 [4] - 昊志机电已构建“N+1+3”的机器人业务体系,其减速器相比国际17规格以下同类产品,传动精度提升66.7%,振动峰值下降60%,声音强度降低约22.7分贝,达到世界领先水平,已送样头部人形机器人厂商测试 [4] - 雷赛智能已实现FM系列高密度无框力矩电机的量产,年产能30万台;已实现空心杯电机量产,年产能12万台 [5] - 卧龙电驱的无框力矩电机及多种关节模组产品已与多家仿生机器人下游客户开展联合研发和送样测试,部分客户已形成小批量订单 [5] 谐波减速器相关公司 - 绿的谐波为国内谐波减速器龙头,2022年谐波减速器国内市占率26%排名第二,2021年全球市占率约7%,机器人相关收入占总收入比例超过80%,谐波减速器规划产能为100万台/年 [6] - 汉宇集团2022年谐波减速器国内市占率达6%,谐波减速器产能为10万台/年 [6] - 斯菱股份为国内轴承第一梯队企业,聚焦于谐波减速器的研发和量产,产品适用于工业机器人、协作机器人、人形机器人等多个应用场景 [5] - 丰立智能的谐波减速器产能规划四条产线14万套,已投一条产线3.5万套;博世集团是公司第一大客户,也是特斯拉核心供应商 [6] 其他部件相关公司 - 斯菱股份购买银球科技股权有助于拓展精密轴承业务,通过产业协同共同推动在精密轴承、汽车零部件、机器人零部件等重要领域的深度合作 [5] - 汇川技术收购长春汇通后实现光编码器自制 [4] - 奥普光电的子公司禹衡光学是国内编码器领域领军企业,产品已顺利导入华中数控、广数等客户,并与新松机器人展开合作 [4]
宇树发布人形机器人App Store,一键还原李小龙招牌动作
21世纪经济报道· 2025-12-13 10:34
公司核心业务动态 - 宇树科技于12月13日宣布首发人形机器人“App Store”(应用商店)[1] - 该平台允许用户上传分享训练好的舞蹈、武术、干活等模型,并可下载其他开发者的动作部署到机器人[1] - 平台包含由真实机器人采集的数据,用户可上传或下载数据集用于算法训练和优化[3] - 平台旨在为零经验爱好者、独立开发者及大型团队节省大量重复开发时间[3] - 公测版已释出搞笑动作、扭扭舞、李小龙三大预设程序[5] - “李小龙”程序通过独家动力学算法与动作捕捉数据,将经典截拳道动作库移植到用户机器人硬件上[5] 行业竞争格局 - 除宇树科技外,智元机器人也于10月推出“灵创”平台,这是一个0代码、0门槛的机器人内容创作平台[5] - “灵创”平台允许用户无需编程基础和专业设备,仅通过上传人类动作视频即可实现从真人表演到机器人精准复刻的端到端转化[5] 公司背景与财务表现 - 宇树科技成立于2016年8月26日,是一家聚焦消费级、行业级高性能通用足式/人形机器人及灵巧机械臂自主研发、生产与销售的高新技术企业[6] - 公司由王兴兴创立[6] - 截至今年6月,公司创始人透露其年营收已超过10亿元人民币[7] 首次公开募股进展 - 宇树科技的IPO进程进入加速阶段[8] - 11月15日,中国证监会披露的辅导更新信息显示,其辅导券商中信证券已递交辅导工作完成报告,公司辅导状态被标注为“辅导验收”[8] - 此举意味着公司已完成递交IPO招股书前的准备工作[8] - 按照官方透露的计划,公司预计在10月到12月期间正式递交IPO招股书,项目推进节奏顺利[8]
第三批展商阵容重磅揭晓!绿的谐波、晶品特装、青瞳视觉等硬核企业强势入局,第六届中国机器人行业年会邀你赴杭共话未来!
机器人大讲堂· 2025-12-13 07:32
行业大会概览 - 第六届中国机器人行业年会将于2025年12月18日至19日在浙江杭州举办,大会主题为“见证中国机器人领军企业力量,点亮具身智能时代变革新星”,聚焦人形机器人技术与具身智能价值 [1] - 本届大会共有21家参展企业,第三批公布的6家展商为绿的谐波、晶品特装、青瞳视觉、PNP机器人、安培龙、售后宝 [1] 参展企业介绍 苏州绿的谐波传动科技股份有限公司 - 公司是全球领先的核心零件制造商,自2003年起专注精密谐波传动技术,率先打破国外技术垄断,在谐波减速器领域国内市占率第一、全球第二,入选全球人形机器人百强 [1] - 公司于2020年在科创板上市,是国家专精特新“小巨人”与制造业单项冠军,拥有160项专利,主导6项国家标准,产品广泛应用于机器人、具身智能、智能制造等领域 [1] - 公司展品包括谐波减速器、一体化关节模组、伺服电机泵等 [2][4][7] 北京晶品特装科技股份有限公司 - 公司成立于2009年,是国家专精特新“小巨人”企业,科创板股票代码688084,长期专注于高科技军民两用装备的研发与制造 [9][10] - 公司聚焦“智能装备”主航道,具备复杂系统抓总和核心上游部件研制能力,自主开发了系列化机器人、系列化光电雷达侦察设备、系列化高精密吊舱/导引头等产品 [10] 上海青瞳视觉科技有限公司 - 公司以计算机视觉与人工智能为核心,构建了高精度3D智能感知与人机交互技术体系,核心技术自主化率达100% [12][13] - 近三年研发投入占比近20%,累计获得50余项软件著作权及10多项专利,并参与5项国家及团体标准制定 [13] - 业务覆盖具身智能、工程科研、虚拟现实等六大领域,已为华为、腾讯、清华大学等超1000家头部机构提供解决方案 [13] - 公司展品包括光惯融合手套 [14] 集智联机器人(苏州)有限公司 (PNP机器人) - PNP机器人是德国Franka机器人中国区负责方,致力于提供前沿的具身智能解决方案,打造了基于FRANKA机器人的具身智能成套产品 [17][18] - 公司目标是构建“一站式具身智能研究平台”,帮助客户将精力投入到具身智能算法、模型和应用的深入研究 [18] - 展台将展示基于力控与位置控两种模式的遥操作主手,并提供Franka机器人遥操作体验、力反馈操作主手体验以及Diana7机器人自主齿轮装配展示 [19][21] 深圳安培龙科技股份有限公司 - 公司是一家集智能传感器研发、制造、销售、服务为一体的第一批国家专精特新“小巨人”企业,股票代码301413 [23][24] - 主营业务产品包括压力传感器、力传感器、氧传感器、热敏电阻及温度传感器,广泛应用于汽车、机器人、智能家居、光储充新能源等领域,销售网络遍及全球几十个国家和地区 [24] - 公司依托敏感陶瓷技术、MEMS技术、IC设计技术三大研发平台,自主掌握了MEMS传感器芯片研发的核心技术,具有从芯片研发到生产的完整垂直产业链 [24] - 公司拥有深圳、东莞、湖南郴州、泰国四大生产基地以及深圳、上海、德国、比利时、武汉等研发中心 [25] 众联成业科技有限公司 (售后宝) - 众联科技是国内数字化服务运营领军者,连续五年入选准独角兽企业,售后宝是其自主研发的基于AI的智能客户服务平台 [32][33] - 售后宝已服务制造业客户5000+,其中50+世界500强企业、300+上市公司 [33] - 平台提供在线客服、400电话、邮件客服等能力,支持售前、售中、售后服务管理,以及二次营销和仓储资源管理 [35][36][37][38][39][40][41][42][43] - DeepService是企业级智能客户服务平台,以深度智能赋能场景,实现客户服务智能自动化 [33] 大会议程与嘉宾 活动议程亮点 - 大会活动亮点包括双日五维深度体验、全产业链实战分享、权威榜单树立行业标杆、年度主题引领发展思潮、十周年庆典共绘新蓝图 [48] 部分演讲议程 - **12月18日上午**:议题涵盖具身智能的进化路径与关键挑战、当前人形机器人热、工业具身智能落地路径、核心零部件产业化、AI+机器人融合趋势、下一代人形机器人触觉、谐波传动及行星滚柱丝杠技术新发展等 [49][50] - **12月18日下午**:议题聚焦机器人智能操作前沿,包括六维力及关节力传感器、以灵巧手和云端智脑为核心的平台、机器人力传感技术、具身智能发展思考、机器人规模化之路、人形机器人具身智能发展挑战、人形交互机器人应用、具身智能操作系统等,并以圆桌论坛探讨具身智能技术商业化机遇与挑战 [51][52] - **12月19日**:议题围绕机器人行业创新与产业化落地,包括具身智能国家队产业化范式、人形机器人工业场景落地、赋能具身智能行业未来、技术到生产落地的应用实践、加速商业场景真实落地、协作机器人应用趋势、AI驱动工业未来、宇树科技实践、跨越商业化落地的关键阶梯等 [52][53] - **12月19日下午**:议题涉及变革技术产业新势力,包括世界模型激活具身智能、腿足式机器人研究、高性能电子皮肤、具身智能的重要引擎、人形机器人商业化路径、专用驱动模组设计等 [54] 部分参会嘉宾 - 参会嘉宾包括来自中国计量大学、北京航空航天大学、哈尔滨工业大学、浙江大学、国家自然基金委、北京理工大学等院校的教授与负责人 [57][58][59][60] - 企业嘉宾包括埃斯顿自动化、埃夫特、绿的谐波、五八智能、开普勒机器人、因时机器人、华威科、浩海星空、大咖机器人、蓝点触控、智身科技、零次方机器人、云深处科技、宇树科技、灵心巧手、节卡机器人等公司的高管 [60][61][64][66][67][68][69][70][72][73] 赞助与合作伙伴 - 大会总冠名为因时机器人,首席合作伙伴为灵心巧手,战略合作伙伴包括绿的谐波、云深处科技、华威科、星汇传感等 [74] - 精英合作伙伴为蓝点触控,合作伙伴包括优必选、宇树、珞石、大咖机器人等众多行业企业 [74][75]
广东鼎泰智能技术有限公司成立 注册资本2000万人民币
搜狐财经· 2025-12-13 05:01
天眼查App显示,近日,广东鼎泰智能技术有限公司成立,注册资本2000万人民币,经营范围为一般项 目:智能机器人的研发;机械设备研发;电机及其控制系统研发;新材料技术研发;五金产品研发;智 能机器人销售;工业机器人制造;工业机器人销售;工业机器人安装、维修;电子元器件与机电组件设 备制造;电子元器件与机电组件设备销售;电子专用设备制造;电子专用设备销售;特种陶瓷制品制 造;特种陶瓷制品销售;金属工具制造;金属工具销售;非金属矿物制品制造;非金属矿及制品销售; 真空镀膜加工;软件开发;软件销售;人工智能应用软件开发;货物进出口;技术进出口。(除依法须 经批准的项目外,凭营业执照依法自主开展经营活动)。 ...
SpaceX要上市,马斯克要做第一个万亿富豪 | 融中投融资周报
搜狐财经· 2025-12-13 03:44
机器人及自动化 - 上海智世机器人完成数千万元A+轮融资 由隐峰资本独家投资 公司专注于四向穿梭车研发制造 旨在提升密集立体仓库的存储密度和出入库效率 [2] - 软银集团与英伟达正就投资机器人基础模型公司Skild AI进行深入谈判 融资规模预计超10亿美元 投后估值或达约140亿美元 较其B轮融资时的47亿美元增长近两倍 [6] - Skild AI专注于开发作为各类机器人“大脑”的通用人工智能软件系统 通过训练AI模型赋予机器人类似人类的感知、推理与决策能力 以解决通用机器人在多环境中部署受限的瓶颈 [6] 储能技术 - 液态金属电池储能企业武汉吉兆储能完成数千万元天使+轮融资 由光合创投领投、顺为资本跟投 资金将用于支持全球首个MW级液态金属电池储能系统交付应用 [2] - 吉兆储能于2024年10月建成国内首条液态金属电池10MWh中试产线 目前不同规格电池产品及储能系统已批量下线 [2] 生物医药与AI制药 - 全球AI驱动药物研发平台深度智耀完成近5000万美元D轮融资 由鼎晖百孚领投 老股东新鼎资本、红杉中国加注 [4] - 肿瘤及免疫精准治疗药物研发商德昇济医药完成1.08亿美元B轮融资 投资方包括IDG资本、松青资本、Medicxi、淡马锡、红杉中国、经纬创投、药明康德 [5] - 普瑞基准完成超亿元新一轮融资 资金将重点支持公司在“生物学+AI”领域的深入布局 加速AI驱动的药物研发创新 [7] - 普瑞基准依托多组学技术与AI算法 开发了AIBERT®数据挖掘系统 为药企提供从靶点发现到临床研发策略等服务 并已与多家领先药企形成深度合作 [7] 半导体与生物技术交叉 - 深圳栅极芯致生物科技完成融资 公司专注于生物技术与半导体交叉领域 致力于通过半导体技术打造高通量、高灵敏、低成本、快速的蛋白组学检测平台 [4] - 公司核心技术为基于晶体管传感器的阵列式表面传感系统 用一张芯片代替显微镜 并打造了基于液滴微流控的超灵敏单分子免疫检测平台 [4] 航天与特殊核素 - SpaceX正推进IPO计划 拟募资超300亿美元 目标估值达1.5万亿美元 有望刷新全球最大IPO纪录 [5] - 若SpaceX以1.5万亿美元估值上市 马斯克持有的约42%股份价值将从1360亿美元增至6250亿美元以上 其总财富预计将达到9520亿美元 较当前增加约4910亿美元 [3] - 西安迈斯拓扑科技完成近亿元天使轮融资 资金将主要用于绵阳医用同位素生产基地建设 目标在2026年底实现Ac-225、Pb-212、Cu-67等创新核素的商业化供应 [5] 新能源材料与投资 - 电解液供应商Green Energy Origin完成1.1亿美元的B轮融资 由BlueCrest Capital Management领投 启明创投跟投 老股东持续加注 [4] 资本市场与基金动态 - 海光信息与中科曙光同时公告 正式终止换股吸收合并并募集配套资金的重大资产重组事项 原因为交易规模大、涉及方多、市场环境发生较大变化 [8] - 上海未来产业基金宣布拟参与投资五只子基金 [9] - Granite Asia旗下私募信贷基金完成首轮募资 金额超过3.5亿美元 由淡马锡旗下平台、马来西亚国库控股及印尼主权财富基金INA领投 该基金目标募资总额为5亿美元 目前已落实约30%的可投资资金 [9]
深圳将建全国首个机器人友好示范城区
新浪财经· 2025-12-13 02:37
12月12日至14日,"2025年粤港澳大湾区人工智能与机器人产业大会暨广东省人工智能与机器人技能大 赛"在广州举办。据悉,本次大会上,广东省具身智能训练场"1+1+N"体系将正式发布。"1+1+N"体系包 括:"1"个广东核心中枢——广东省具身智能训练场(简称"省训练场"),由主训练场和管理中心两部 分构成。"1"个深圳示范窗口——深圳具身智能示范区,探索建设全国首个具身智能机器人友好示范城 区,侧重封闭训练后的机器人在街区开放式训练,激活场景价值。"N"个垂直分训练场——横跨不同地 市、深耕不同领域的垂直场景专业化训练平台,联动地市、赋能产业、精准定位、解决痛点,与主训练 场优势互补、资源共享、共建共创、相互赋能。(深圳发布) ...
理性看待机器人产业速度与泡沫
经济日报· 2025-12-13 01:21
行业现状与市场热度 - 人形机器人产业被视为下一代通用人工智能的重要载体,其战略价值毋庸置疑[1] - 以人形机器人为代表的具身智能产业规模正以超50%的增速跨越式发展[1] - 有市场调研机构预测,2030年人形机器人市场规模将达千亿元[1] - 市场观点认为人形机器人市场将持续升温,明年将成为其落地的关键一年[1] - 我国目前已有超过150家人形机器人企业,且数量还在增加,其中半数以上为初创企业或“跨行”入局者[2] 潜在风险与过热苗头 - 市场担忧当前人形机器人在技术成熟度、应用场景、安全性等方面仍有不少缺陷,市场过热或引发投资泡沫[1] - 在资本市场过度追捧、地方政府“一哄而上”的产业布局下,一些公司的市场估值短期内翻了数番,但商业化落地远未跟上预期步伐[2] - 真正的风险在于资本过度集中在少数“讲故事”的企业,过于强调投资市场回报而忽略了基础研发、核心零部件突破、应用场景深耕等长期投入[1][2] 产业发展建议与方向 - 在政策端,需加速构建行业标准与评价体系,建立健全行业准入和退出机制,并加快关键核心技术攻关[3] - 在资本端,投资者需建立更专业的技术判断力,关注企业的核心技术壁垒、工程化能力与商业化路径,并发挥长期资本、产业资本的积极作用[3] - 在企业端,机器人企业需要回归商业本质,从真实需求出发构建产业链闭环,深耕产业协作与生态培育[3] - 新兴产业治理的关键在于合理引导,既要强化政策牵引、加快技术攻关、推动成果应用,也要最大限度发挥市场机制作用[2] 核心观点总结 - 对于具身智能产业,需要把握和平衡“速度”与“泡沫”的问题[1] - 在产业发展初期保持适度“泡沫”一定程度上有利于产业竞争,但须保持战略定力,既要包容试错也要防范泡沫风险[4] - 平衡“速度”与“泡沫”的目的是以更理性、可持续的方式为产业发展“添柴加火”,增强产业全球竞争力,将技术红利转化为经济高质量发展的动力[4]
看一次就能执行!VLA的零样本学习是伪命题吗?
具身智能之心· 2025-12-13 01:02
文章核心观点 - 北京理工大学与LimX Dynamics联合提出的ViVLA框架,通过“统一动作空间构建-并行解码优化-大规模数据生成”的三层技术体系,首次实现了机器人从单段专家示范视频中高效学习新技能,为通用机器人策略学习提供了全新范式 [1] - ViVLA的核心目标是“单样本视频模仿学习”,旨在解决现有视觉-语言-动作模型难以泛化到训练分布之外任务的核心瓶颈 [1] - 该框架在多个基准测试和真实场景中验证了其有效性,特别是在未见过的任务上实现了显著的性能提升,并成功将人类视频知识迁移至机器人动作 [14][16][25] 问题根源与挑战 - **细粒度动作识别能力不足**:现有视觉语言模型侧重语义级视频理解,难以分辨示范视频中精细的操纵动作,导致无法提取关键操作知识 [4] - **动作表征与模态差异**:人类示范视频缺乏动作标注,且专家与目标机器人的动作空间存在本质差异,传统方法无法实现有效知识迁移 [5] - **数据稀缺**:机器人学习领域缺乏丰富多样的专家-智能体配对数据,现有数据集规模小、场景单一,难以支撑通用模型训练 [7] 方案设计:ViVLA的三层技术闭环 - **第一层:统一动作空间**:提出基于动作中心循环一致性的A3C框架,构建跨专家与智能体的统一潜在动作空间,以解决形态鸿沟与动作表征问题 [8][10] - **第二层:模型训练优化**:对视觉-语言-动作模型架构进行两大核心优化,包括并行解码机制与时空掩码策略,以提升推理效率与视频理解能力 [8][12] - **第三层:大规模数据生成**:设计了可扩展的数据生成流程,将人类视频转化为高质量配对数据,最终整合生成了超过89万条专家-智能体训练样本 [8][13][17] 验证逻辑与性能表现 - **LIBERO基准测试**:在包含130个语言条件操纵任务的LIBERO基准测试中,ViVLA在未见过的任务上实现了超过30%的性能提升,成功率从基线模型的0.13提升至0.65 [14] - **跨形态迁移**:在“UR机械臂示范-Franka机械臂执行”的跨形态实验中,ViVLA的未见任务成功率仍保持63%,较基线模型提升超过35% [15] - **真实世界验证**:在12项真实世界操纵任务中,ViVLA从单段人类示范视频中学习技能,未见任务成功率达74%,较AWDA的36%提升超过38%,部分任务成功率高达100% [16][19] 数据生成与规模 - 通过整合7421个人类示范视频,生成了89,736条人类-机器人配对样本,并结合公开数据集,最终形成了总计892,911条专家-智能体训练样本 [13][17] - 使用的数据集包括Fractal、Bridge、Droid、Language Table、BC-Z、FMB Dataset、Ego4D、EgoDex以及生成的Human2Robot数据集 [13] 技术细节与优化 - **并行解码机制**:摒弃自回归生成,采用单次前向传播同时生成所有动作token,大幅降低了推理延迟 [12] - **时空掩码策略**:对输入视频进行时间与空间维度的随机掩码,强制模型从部分观察中预测动作,强化了全局视频理解能力 [12] - **循环一致性约束**:引入动作缓冲池和局部-全局判别器,强制跨模态动作语义对齐,确保动作表征的鲁棒性 [11] 鲁棒性与消融分析 - **环境鲁棒性**:面对物体数量变化、空间布局调整、相机视角切换与光照变化,ViVLA整体成功率保持在70%以上 [20][23] - **组件有效性**:消融实验表明,A3C循环一致性、时空掩码、并行解码均为关键贡献模块,移除后未见任务成功率最高下降38% [24] 局限与未来方向 - **感知局限**:静态相机难以捕捉精细的机器人-物体交互细节,部分场景因遮挡导致抓取精度不足,未来可引入腕部相机提升视角 [27] - **误差恢复**:当前模型缺乏系统的错误恢复能力,未来可通过在数据生成阶段添加轨迹扰动与恢复序列来增强鲁棒性 [27] - **数据规模**:现有数据依赖人工收集的人类视频,未来可探索互联网级人类视频的自动过滤与配对,以进一步扩大数据多样性 [27] 范式价值与行业影响 - ViVLA建立了“数据生成-模型优化-知识迁移”的完整技术链路,通过3D高斯splatting破解配对数据稀缺难题,通过A3C框架与并行解码解决动作表征与推理效率问题 [25] - 其超过89万规模的专家-智能体数据集与模块化架构,为通用机器人策略学习提供了可复用的技术底座,推动机器人从“特定任务训练”向“零样本技能迁移”转型 [25]
专访张崟:解码“软硬融合”的广东AI与机器人产业路径
21世纪经济报道· 2025-12-13 00:14
文章核心观点 - 广东省人工智能与机器人产业依托其“软硬融合”的独特优势,正通过产业联盟的“十个一”工程、百亿产业基金及三大关键举措,加速技术从实验室向规模化商用转化,并致力于在具身智能、端侧AI等高端赛道实现差异化发展和价值链跃升 [1][2][3][7][10][11] 产业发展现状与区域优势 - 广东人工智能与机器人产业近期高频亮相,例如全运会火炬手机器人“夸父”、开幕式表演机器人Walker S2以及地铁站智能服务矩阵,直观反映了产业加速发展的态势 [1] - 广东省人工智能与机器人产业联盟于2024年6月成立,汇聚多方创新主体,并推动包括一项发展指数、一张产业链图谱、一本白皮书、一批应用场景、一场创新创业大赛、一个奖项、一个产业大会、一个博览会、一个产业信息平台、一支产业基金在内的“十个一”重点工作 [2] - 广东的差异化发展路径在于“软硬融合”,既为AI提供海量工业数据作为“燃料”,又为机器人提供最完善的硬件产业链作为“载体” [3] - 在人工智能领域,广东在芯片、大模型、算力、数据、应用、终端等方面构建了完备的产业体系,以华为为代表的龙头企业芯片研制水平及生态成熟度全国领先 [3] - 在智能终端产量方面,广东占据绝对优势:2024年,全省手机、计算机、电视机、智能手表产量分别占全国产量的40.9%、24.6%、57.7%、35.3% [3] - 广东工业机器人产量占全国44%,连续五年位居全国第一,拥有涵盖整机、关键零部件、系统集成的完整产业链,是核心制造基地与供应链枢纽 [3] - 即使研发总部位于北京、上海的国内头部机器人企业,其本体制造与供应链配套仍高度依赖广东 [3] 技术突破与商业化进展 - 广东紧扣“人形机器人”与“行业大模型”双主线,生成式AI备案规模占全国近两成,稳居第一梯队,并在AR光波导、人形机器人高精度力控等核心技术上取得突破 [4] - 截至2025年10月,广东省累计完成生成式人工智能服务备案105款,占全国备案总量的约17%,数量位居全国前二 [5] - 脸萌科技推出“即梦AI”智能体代理模式,用户输入简单想法即可在零人工干预下一键生成54秒高质量长视频 [5] - 雷鸟创新研发的AI眼镜,通过“RayNeo光波导”技术将光引擎压缩至0.36cc,在76克机身内实现6000尼特入眼亮度与95%良率 [5] - 越疆科技人形机器人Atom完成全国首例工业跨场景多任务协同泛化应用 [5] - 小鹏人形机器人IRON拥有全身82个自由度(远超行业平均的60-70个)与22个手部自由度,结合实时传感算法,实现了柔性抓取与高精度力控的持久稳定作业能力 [5] - 依托广汽、小鹏、大疆等领军企业,广东在智能网联汽车、智能制造及低空经济等赛道跑通了规模化商用闭环 [6] - 在智能网联汽车领域,广汽埃安、小鹏汽车已实现L2+/L3级辅助驾驶的量产普及 [6] - 在智能制造方面,美的库卡、拓斯达等企业的装备广泛应用于核心产线 [6] - 在低空经济领域,大疆无人机已在植保、巡检与物流场景实现常态化作业,构建了成熟商业模式 [6] 产业联盟的关键举措 - 联盟致力于通过应用场景创新加速科研成果转化,重点推出三大关键举措 [7] - 举措一:打造广东省人工智能与机器人产业信息平台,一期已完成超4.6万家企业数据归集,二期计划在2024年12月底前上线“AI智脑匹配”等新功能,并构建20个产业链图谱 [7] - 举措二:积极推动具身智能训练场建设,支持企业在真实场景中进行数据积累与模型迭代 [7] - 举措三:谋划建设粤港澳大湾区人工智能与机器人应用场景创新中心,以“场景孵化”为核心构建产业生态服务体系 [7] - 联盟通过举办创新创业大赛、设立卓越奖(XAIR奖)并挖掘典型案例来加速技术转化和赋能产业升级 [8] - 2025年粤港澳大湾区人工智能与机器人产业大会吸引了近千家企业参与,并同步发布《2025年广东省人工智能与机器人产业发展白皮书》及颁发XAIR奖,获奖项目将优先获得产业基金支持 [8] 资本支持与未来规划 - 为助力产业发展,设立了目标规模100亿元的广东省智能产业基金,目前已完成首期60亿元资金的确认 [10] - 该基金坚持“投早、投小、投硬科技”原则,重点关注具身智能、核心传感器、AI芯片以及工业软件等长周期、高壁垒领域,并已通过“创客广东”大赛储备了29个优质早期项目 [10] - 该基金被定位为“耐心资本”,重点支持“卡脖子”技术攻关,联盟还与广晟资本共建一只2亿元的创投基金,为百亿基金提供“种子项目”,形成覆盖项目全生命周期的资本支持体系 [10] - 广东省政府通过“资金减负、算力普惠、场景引流”三大举措降低企业运营与试错成本,并提供市场验证空间 [10] - 未来3-5年,广东计划将人工智能技术深度融入手机、计算机、平板、家电等产品,推动其从“智能工具”向“智能助理”升级,以提升附加值和竞争力 [11] - 联盟将发布“AIR珠江指数”和产业发展白皮书确立技术风向标,并利用百亿基金重点引导企业布局人形机器人核心部件、端侧AI芯片及低空经济等高增长、高壁垒赛道,推动产业向价值链高端跃升 [11]