Workflow
具身智能
icon
搜索文档
上海AI Lab王靖博:人形机器人,从「盲动」走向「感知驱动」丨GAIR 2025
雷峰网· 2025-12-23 00:34
文章核心观点 人形机器人控制正从依赖力反馈的“盲走盲动”阶段,迈向融合环境感知的“感知驱动”新阶段,通过创新的感知方案、统一的行为基础模型以及高效的Sim2Real迁移技术,旨在实现机器人在复杂非结构化环境中的长程、通用且稳定的自主运动与交互能力[3][4][44] 人形机器人研究的必要性与价值 - 研究人形机器人具备天然通用性,因为现实生活环境围绕人类需求搭建[3][9] - 互联网上存在海量源于人类日常生活的第一人称和第三人称数据,为模型训练提供了丰富的运动与操作逻辑资源[3][9] - 相关研究(如交互逻辑与安全性)最终将回馈到人类自身,例如提升自动驾驶等领域的人机交互安全[3][9] 核心挑战:Sim2Real迁移与感知融合 - 人形机器人研究的核心问题之一是如何在仿真中训练并使其技能稳定迁移到真实世界,即跨越Sim2Real鸿沟[3][10] - 控制策略转向“感知驱动”是必然趋势,需要融合视觉、激光雷达等感知以实现复杂环境中的自主导航与交互[4] - 实现带感知的局部运动需解决四大问题:环境构建、感知方案选择、环境表征形式、以及与运动策略的联合训练[17] 创新的感知与环境表征方案 - 团队摒弃了RGB相机(存在光照纹理差异、缺乏几何信息)和深度相机(仿真数据过于干净、存在噪声鸿沟)等传统方案[14][15] - 最终采用激光雷达,并将点云转化为体素形式进行环境表征,以压缩信息、去除冗余并提升效率[15][18] - 在仿真中创新性地引入了机器人本体的激光雷达自扫描功能,以更好地对齐仿真与真实的传感器数据分布,显著缩小了Sim2Real鸿沟[3][20][21] 感知驱动的运动控制优势 - 新方案使机器人能提前感知地形变化(如台阶、吊顶)并预先规划动作,而非依赖碰撞后的力反馈,提升了安全性与预判性[3][22][25] - 改装后的机器人拥有足够大的视场角,能实现全向运动,并支持多种地形的训练,实现全地形运动能力[20] - 该方案的Sim2Real表现非常一致,仿真中的策略研究能可信地迁移到真实世界[28] 构建通用的行为基础模型 - 为实现机器人技能的通用性,需要建模一个“行为隐变量”,使机器人能根据环境或任务选择不同隐变量,灵活组合技能[28][29] - 团队选择打造“任务感知型”机器人,其隐变量直接参与任务决策,可实现快速迁移,无需额外训练高层控制器[31] - 构建过程分为四步:数据重构、训练代理智能体、设计控制模式与掩码、以及通过师生学习框架实现Sim2Real迁移[32] 模型能力与实验验证 - 模型不仅能完成基础运动跟踪,还能响应姿态与运动指令,并支持全身遥操作和复杂动作(如原地起立)[33] - 隐变量分析显示其具备结构化特征,不同运动对应的隐变量特征区分明显,且可通过线性组合完成复合动作(如回旋踢)[33][34] - 在对比实验中,该方法比任务专用模型抗过拟合能力更强,比不带隐变量的方法跟踪精度更高[34] 交互任务的拓展与技能组合 - 针对交互任务数据稀缺、精度要求高的特点,采用生成式模仿学习框架,用运动先验约束合理性并融入任务奖励[35] - 通过分离式任务头设计、构建大规模多样化仿真环境、以及设计专属任务掩码,训练出通用的感知编码器[36] - 提出高效技能组合方法论,通过复用技能表征、引入专用地形感知、调用通用本体感知器及动作适配,使机器人能完成如复杂地形中搬运箱子的复合任务[38][39] 未来发展方向 - 行业正从“盲走盲跳”的纯运动演示阶段,迈向“感知驱动”的新阶段[44] - 未来突破可能在于采用离线监督学习的方法,收集足够多数据以构建参数量更大的模型(向GPT级别靠拢),从而赋予机器人更长程的控制能力[4][47] - “规模化扩展”是重要方向,但当前在线强化学习方式与板载算力限制制约了用超大模型探索更多技能与控制形式[47]
快手直播间出现大量涉黄内容,快手回应:遭到黑灰产攻击;吉利汽车宣布完成极氪私有化;Waymo无人车闯祸了!路口集体趴窝导致堵车
雷峰网· 2025-12-23 00:34
自动驾驶与Robotaxi - Waymo数十辆自动驾驶出租车因旧金山大范围停电导致红绿灯失灵而集体在十字路口停滞,造成交通拥堵,有乘客被困车内数十分钟[4] - 此次停电由太平洋燃气电力公司变电站火灾引发,波及约13万用户,覆盖旧金山约30%区域[4] - Waymo解释其系统设计为在信号灯失效时按四路停车规则通行,但此次停电规模过大导致车辆确认路口状态时间过长[4][5] - 特斯拉借机宣传其FSD系统,发布视频显示其Robotaxi能在无红绿灯路口自主执行四路停车规则,并称其系统已在数十亿英里现实世界里程中训练[5] - 特斯拉目前在湾区运行的Robotaxi仍配备安全员[5] AI硬件与可穿戴设备 - 小米系创业公司光帆科技将发布全球首款搭载摄像头的AI耳机,产品集成视觉摄像头与多模态感知,定价预计在2000元档位[8] - 光帆科技成立于2024年10月,由前小米自研手机及汽车OS负责人董红光创办,公司近期完成多轮融资,估值将增长至10亿元[8] - 产品亮点为自研的AgentOS及摄像头的环境感知功能,适配场景包括AI选餐厅、提醒日程等,旨在不依赖手机完成点外卖、订机票等日常需求[8] - 公司内部认为最佳穿戴式AI产品需离耳朵和眼睛更近,且需有成熟的消费者心智教育,因此选择先做AI耳机[9] 中国科技公司人事与组织调整 - 百度MEG进行新一轮调整,技术研发由副总裁赵世奇负责,用户侧产运由副总裁李小婉负责,搜索相关业务已合并统一管理[13][14] - 前字节跳动Seed大模型视觉基础研究团队负责人冯佳时已加盟腾讯,担任腾讯AGI研究中心多模态团队负责人[18] - 冯佳时于2019年加入字节,曾被部分媒体誉为字节大模型“关键8人”之一,并曾为张一鸣提供一对一AI辅导[18] 消费电子与手机行业动态 - 小米总裁卢伟冰确认小米17 Ultra将涨价,且涨幅会“有点多”,主要原因是2025-2027年为内存成本上涨期,内存价格猛涨导致手机成本大幅上升[21] - 小米17 Ultra厚度为8.29mm,较前代减薄11.3%,为小米Ultra史上最薄,起售价将高于前代小米15 Ultra的6499元[21] - 荣耀高管林林表示整个电子行业成本趋势非常恶劣且将持续至少一两年,手机涨价不可避免,甚至已发布产品也可能突破原价,二手手机也可能涨价[32] - 华为发布nova 15系列,其中Ultra和Pro版搭载麒麟9010S芯片,标准版搭载麒麟8020,整机性能较上代nova 14 Ultra提升18%,起售价2699元[34][35] 企业资本运作与私有化 - 吉利汽车宣布已完成对极氪的私有化,极氪现为其间接全资附属公司,财务业绩将并入集团报表,极氪已从纽交所退市[14][15] - 高性能电动汽车品牌极星获得吉利瑞典控股集团提供的6亿美元贷款额度以维持运营,其中最后3亿美元需根据流动性需求获得同意[31] - 极星2025年销量有所回升,但财务状况仍面临挑战,公司旗下共有四款车型在28个国家销售[31] AI与机器人产业融资与发展 - 智元机器人创始人邓泰华透露,公司今年有望实现5000台机器人出货,销售收入有望超过10亿元,预计明年起出货量与收入将保持数倍增长[33] - 智元机器人发布第三方租赁平台“擎天租”,预计机器人租赁市场规模今年已突破10亿元,明年规模不低于100亿元[33] - 诺亦腾机器人完成Pre-A+轮融资,累计募集资金达数亿元人民币,本轮由启明创投领投,资金将用于具身智能多模态数据研发与规模化数据生产体系建设[29] - 诺亦腾机器人是一家面向具身智能与人形机器人产业的数据公司,以提供高质量训练数据为核心[29] 互联网平台与内容治理 - 快手平台多个直播间出现大量色情内容,平台回应称遭到黑灰产攻击,已紧急处理并报警,异常行为疑似与东南亚黑产团队有关[10] - 山姆App部分商品评论区用户实拍图片在被点开时饱和度会自动提高,与未点开原图存在明显差异,山姆客服称此为8月上线的测试功能,处于长期测试优化阶段[27] 国际科技巨头与AI竞赛 - 微软CEO纳德拉亲自抓AI产品,每周与约100名核心技术人员开会,反复追问进展并施压负责人,对消费级Copilot与邮箱连接功能表现不满[41] - 纳德拉加大AI人才招聘参与力度,亲自联系候选人并批准高竞争力薪酬方案,以从OpenAI和谷歌DeepMind挖角[42] - OpenAI CEO奥特曼称公司将保持每年1-2次的“红色警报”紧急状态,每次持续6到8周,以应对竞争威胁[44][46] - 近期“红色警报”由谷歌Gemini 3和中国厂商DeepSeek的技术表现触发,OpenAI为此集中精力发布了GPT-5.2模型[45][46] 芯片与半导体产业 - 英伟达获美国联邦贸易委员会批准,将对英特尔进行50亿美元战略投资,获得近4%股权,双方将共同开发基于x86架构的定制化CPU并与GPU深度集成[49] - 此次投资被视为将NVLink标准嵌入x86生态的关键一步,可能影响AMD及ARM生态的竞争格局[51] - 为应对存储芯片剧烈涨价,一家全球头部PC厂商(推测为联想或惠普)高管密集拜访三星、SK海力士、美光等供应商并达成供货保障协议[46][47] - 联想集团最新季度PC业务全球市场占有率达25.5%,惠普为19.8%[47] 汽车产业与海外市场 - 德国铁路公司向比亚迪订购200辆电动巴士,作为其总价值超10亿欧元的3300辆巴士采购计划的一部分,车辆将在比亚迪匈牙利工厂生产[47][48] - 德国财政部长对此表示不满,希望订单交给德国或欧洲制造商,此举被中方专家批评为贸易保护主义[48] - 保时捷中国回应将自2026年3月1日起有序裁撤自建的“保时捷尊享充电”服务设施,转向与第三方头部充电运营商合作,目前自建充电站约有200家[43] 企业薪酬与职场趋势 - 比亚迪确认对技术研发人员实施专项涨薪,覆盖全岗位序列,最高单次调薪幅度达3000元,部分项目组平均调薪幅度超20%[12] - 比亚迪技术岗每年有两次晋升窗口,晋升后薪资涨幅普遍在10%-15%,叠加本次调薪,资深工程师年收入增幅可超30%[12] - 智联招聘报告显示,国内8.4%的公司已正式推行“强制下班”制度,78%职场人会因内卷环境而跳槽[23] 其他行业要闻 - 影石创新旗下影翎Antigravity全景无人机上市2周内,网络上出现超过2500条虚假恶意内容,公司已报案并最高悬赏10万元征集线索[24][25] - 意大利竞争与市场管理局因滥用市场支配地位对苹果公司处以9863.5万欧元罚款,约合8.1亿元人民币,苹果表示将上诉[43][44] - 阿里千问发布“2025十大AI提示词”榜单,“股票”排名榜首,阿里巴巴已成立千问C端事业群,目标将其打造成AI时代用户第一入口[38]
日薪300,我在后厂村“手搓”人形机器人
36氪· 2025-12-23 00:33
文章核心观点 - 人形机器人行业当前的生产模式仍处于依赖熟练工人进行“手工作坊”式组装的阶段,距离实现真正的自动化流水线量产尚有距离,其核心瓶颈在于缺乏足够大的真实商业需求来驱动标准化、规模化生产 [3][16][18] 行业生产现状 - 人形机器人的组装环节高度依赖人工,在类似实验室或家电维修部的环境中进行,工人使用螺丝刀、扳手、电烙铁等简单工具,按照纸质工艺手册进行“手搓”式组装 [1][3][5] - 组装工作大部分围绕关节展开,关节由轴承、传感器、电机、减速器等构成,其机械素质和安装工艺直接决定机器人质量,更像制造汽车而非手机 [5][6] - 组装车间位于北京后厂村租金昂贵的写字楼内,与研发部门相邻,便于快速沟通和迭代,而非选择土地和人工成本更低的传统工业区 [7][18] 劳动力与成本 - 组装工人为外包性质,时薪为30元人民币,通过试岗后可签订合同并缴纳五险一金,日薪约300元人民币,工作制度为“986”(早9点至晚8点,周六常加班) [6] - 招聘熟练工人难度大,因为组装工作需要工人理解图纸、具备综合技能和耐心,而不仅仅是重复劳动,熟练工人的价值在该行业中不可替代 [11][13] - 生产氛围相对宽松,负责人对工人有耐心,但依赖“工匠精神”也意味着低效和难以标准化,导致废品率不低 [12][13][15] 量产挑战与需求瓶颈 - 当前的“作坊式生产”模式无法实现大批量生产,且伴随着高昂的时间和人力成本,只要依赖工人手搓,就无法算作真正量产 [15][16] - 将生产置于研发附近,是因为产品仍处于快速迭代阶段,且当前订单量尚不足以支撑建设标准化流水线,手工作业反而更具灵活性 [18] - 行业需要分辨量产是由真实商业需求驱动,还是由政策补贴和投资热度催生的伪需求,仅靠表演和展览等示范项目只能带来小批量阶段性需求,无法支撑持续量产 [18] 公司背景与运营情况 - 所述公司名为“XX智能”,拥有顶尖名校和科技巨头背景,已完成多轮融资,是行业中最顶尖的企业之一 [4] - 公司占据写字楼两层,办公区与互联网公司类似,研发场地布满测试设备、半成品和零部件,AI训练区有数据标注员在进行视觉模型优化 [10][11] - 公司订单数量不少,需要加班加点赶交付进度,组装部门持续招聘新员工,但提升产能依赖找到足够多且熟练的工人,而非简单增加人数 [11]
智元机器人,核心数据曝光!
中国基金报· 2025-12-23 00:29
公司核心数据与预测 - 智元机器人董事长预计2025年销售收入超10亿元,出货量有望超5000台 [1] - 公司2026年的出货量和销售收入预计将保持数倍增长,进入更快商业化阶段 [1] - 公司销售收入从2023年成立当年的仅几十万元,增长到2024年的数千万元,再到2025年有望超10亿元 [2] - 智元机器人已于12月8日实现第5000台通用具身机器人量产下线,初步具备产业化能力 [1] 行业前景与市场空间 - 具身智能的市场空间有望超过手机,未来可能成为工业领域最大的单品 [2] - 预测整个具身智能行业会快速发展,2025年是国内具身智能产业快速发展的元年 [1][2] - 业内共识认为具身智能行业快速发展,技术迭代极快,到2026年年底年初的技术优势可能已落后 [2] - 预计未来5年左右,机器人会达到较高高度,普通人家里可能配置一台从事简单工作 [2] - 智元机器人、宇树科技、云深处科技等头部企业均快速发展,云深处科技于12月9日完成超5亿元C轮融资 [2] 商业模式与租赁市场 - 商业化租赁被认为是机器人产业快速发展的关键路径之一 [3] - 预计2025年国内机器人租赁市场规模超10亿元,2026年预计不低于100亿元 [3] - 擎天租平台旨在将高门槛的机器人使用场景转化为类似共享充电宝的便捷租赁模式,推动行业向生态化、服务化租赁演进 [4] - 擎天租公布“1234战略计划”:目标2026年引入超10家本体厂家、超200家金牌服务租赁商、超3000名内容创作者、超40万名租赁客户 [3] - 擎天租目前已建立触达全国50座核心城市的租赁节点,拥有超600家服务商、超1000台设备,预计2026年内将渗透超200座城市 [4] 市场发展阶段与挑战 - 2025年机器人租赁市场开始兴起并成为趋势,但国内大部分机器人厂商还未量产 [3] - 预计2026年国内实现量产的机器人厂商会逐步增多,形成一定市场规模 [3] - 当前国内很多人使用机器人以尝鲜、猎奇为主,预计未来会逐步成为日常化、规模化产品 [3] - 目前机器人租赁市场存在运营成本高、合作链路复杂、内容同质化严重等痛点 [3]
智元机器人核心数据曝光 董事长预计2025年销售额超10亿元
中国基金报· 2025-12-23 00:26
"布局具身智能,就是在布局未来。"邓泰华表示,具身智能的市场空间有望超过手机,未来可能成为工业领域最 大的单品。 2025年是国内具身智能产业快速发展的元年,智元机器人、宇树科技、云深处科技等头部具身智能企业均快速发 展。 12月9日,云深处科技宣布完成超5亿元C轮融资。云深处科技创始人兼CEO朱秋国表示:"2025年是云深处科技快 速发展的一年,业绩实现快速增长。" "智元机器人2025年出货量有望超5000台,销售收入超10亿元。"12月22日,智元机器人董事长兼CEO邓泰华在全 国机器人租赁生态峰会暨擎天租平台发布会上表示。 智元机器人是国内头部具身智能企业之一,估值已达独角兽企业级别。12月8日,智元机器人第5000台通用具身机 器人量产下线,初步具备了产业化能力。 邓泰华表示,预测整个具身智能行业会快速发展。2026年,智元机器人的出货量和销售收入将保持数倍的增长, 进入更快的商业化发展阶段。 具身智能市场空间有望超过手机 2025年,机器人租赁市场开始兴起并成为趋势。据擎天租平台不完全统计,国内机器人租赁的市场规模在2025年 将超10亿元,预计2026年不低于100亿元。 擎天租CEO李一言表示 ...
快手回应大量色情内容刷屏:遭到灰黑产攻击,已报警;字节大模型关键人物被曝加入腾讯;比亚迪回应技术研发人员涨薪丨邦早报
创业邦· 2025-12-23 00:24
完整早报音频,请点击标题下方小耳机收听 【快手回应大量色情内容刷屏:遭到灰黑产攻击,已报警】 12月22日 晚快手突发严重网络安全事件。大量露骨色情内容短时间内侵入多个直播间,引发 用户恐慌与舆论哗然。大量用户反馈12月22日晚间出现涉黄内容泛滥、低俗擦边直播等问题,部分直播间观看量超10万,平台审核机制疑似失效。快手官 方于23日凌晨回应称,当晚22时左右,平台遭到黑灰产攻击,目前已紧急处理修复中,平台坚决抵制违规内容,相应情况已上报给相关部门,并向公安机 关报警。(新浪科技) 【字节大模型关键人物被曝加入腾讯】 前字节 Seed 大模型视觉基础研究团队负责人冯佳时已经加盟腾讯,担任腾讯 AGI 研究中心多模态团队负责人。 据公开信息,冯佳时 2007 年本科毕业于中国科学技术大学,硕士毕业于中国科学院自动化研究所,博士毕业于新加坡国立大学。曾任新加坡国立大学电 子与计算机工程系助理教授,机器学习与视觉实验室负责人。 冯佳时于 2019 年加入字节跳动,与项亮、王明轩、陈卓、严林等人一同被部分媒体誉为「 2024 年字节大模型关键 8 人」。在去年字节跳动的 Top Seed 人才计划宣传中,冯佳时也位列字 ...
智元机器人,核心数据曝光!
中国基金报· 2025-12-23 00:23
【导读】智元机器人 核心数据曝光,董事长预计2025年销售额超10亿元 中国基金报记者 邱德坤 "智元机器人2025年出货量有望超5000台,销售收入超10亿元。" 12月22日,智元机器人董事长 兼 CEO邓泰华在全国机器人租赁生态峰 会暨擎天租平台发布会上表示 。 智元机器人是国内头部具身智能企业之一 ,估值已达独角兽企业级别。12月8日,智元机器人第5000台通用具身机器人量产下线,初步具 备了产业化能力。 " 整个技术发展太快 。 没有想到发展这么快 。"智元机器人合伙人、擎天租董事长姜青松在接受中国基金报等媒体采访时表示。 具身智能行业快速发展已是业内共识。邓泰华表示,到2026年年底,可能会发现企业在2026年年初取得的技术优势已经落后了。 姜青松 预计 ,未来 5年左右,机器人会达到一个 较 高的高度, 可以期待普通人 家里 配置 一 台 机器人 从事 简单工作 。 预计2025年 国内机器人租赁市场规模超10亿元 邓泰华 表示 ,预测整个 具身智能 行业 会 快速发展 。2026年,智元机器人的 出货量和销售收入 将 保持数倍的增长,进入更快的商业 化发展阶段。 具身智能市场空间有望超过手机 ...
帮主郑重:年底“算账”时,跨年“播种”季!
搜狐财经· 2025-12-23 00:21
记住,投资不是冲刺,而是一场马拉松。在年底别人犹豫休息的时候,我们提前想清楚、布好局,或许 就能为明年赢得一个从容的开端。我是帮主郑重,我们共同思考,稳健前行。 那么,该往哪些方向"播种"呢?机构的建议可以概括为两大类,我们不妨称之为 "新故事"与"老伙计" 。 "新故事"是什么?就是那些代表未来五到十年国家发展重心、星辰大海的领域。报告里点名的人工智 能、具身智能、航空航天、量子科技等等,都属于"十五五"规划里的重中之重。它们可能现在盈利还不 稳定,但想象空间大,弹性足,是布局长期趋势不可或缺的部分。 "老伙计"又指谁?就是那些我们熟悉的制造业、资源板块和消费。它们的逻辑很实在:"反内卷"政策会 优化行业竞争格局,让龙头企业的日子好过一些;而全球需求的复苏以及国内扩大内需的努力,则可能 带来实实在在的订单和利润回升。特别是"出海"有优势的企业,相当于打开了新的增长天花板。 我的策略观点是:在年底这个窗口期,我们的布局不妨也采取"核心+卫星"的策略。 用一部分仓位,稳 健地配置在"老伙计"身上,作为持仓的压舱石,追求确定的修复;同时,用另一部分仓位,去前瞻性地 参与"新故事",搏取未来的超额收益。关键在于,不 ...
银河通用机器人拿下1000 台机器人订单
北京商报· 2025-12-23 00:21
北京商报讯(记者 魏蔚)12月23日,北京商报记者获悉,银河通用机器人(以下简称"银河通用")与 精密制造的工业企业百达精工签署战略合作,双方将围绕工业精密制造的复杂场景,开展具身智能机器 人的规模化深度应用,在百达精工及其生态体系内部署超过1000台银河通用具身智能机器人。双方将推 动具身智能机器人在工业核心零部件精密加工制造的全流程规模化落地应用。双方还就核心硬件创新与 供应链优化达成合作共识,银河通用将引入百达精工在核心零部件领域的技术成果。 ...
清华系具身大脑公司获近亿元融资,预计2026年接入设备达十万台以上|早起看早期
36氪· 2025-12-23 00:16
以下文章来源于硬氪 ,作者黄楠 硬氪 . 专注全球化、硬科技报道。36kr旗下官方账号。 在无需遥控与规则编程的前提下, 实现全自主工作与动态环境应对。 文 | 黄楠 编辑 | 袁斯来 来源| 硬氪(ID:south_36kr) 封面来源 | 企业供图 硬氪获悉,北京千诀科技有限公司(以下简称"千诀科技")近日完成近亿元Pre-A++轮融资。我们总结了本轮融资信息和该公司几大亮点: 融资金额及投资机构 融资轮次: Pre-A++轮 融资规模: 近亿元 投资方: 六家知名投资机构及老股东共同参与;Maple Pledge枫承资本长期出任私募股权融资顾问 资金用途: 将主要用于技术研发投入、核心团队人才扩充与全球商业化拓展 公司基本信息 成立时间: 2023年6月 注册地址: 北京市,孵化自清华大学类脑中心 数据层面,企业已构建全球已知范围内的最大规模纯实采家庭场景数据集,累计沉淀亿级规模具身感知与决策预训练数据,覆盖家庭服务、物流、工业运维 等多元场景;同时基于自研的数据标注工艺,可获取任务拆解序列及机器人抓取轨迹等定制化数据,能够独立实现从数据采集、清洗、标注到模型训练的一 体化。 针对规模化落地中技术门槛高 ...