具身智能
搜索文档
信达证券:把握2026年中小盘确定性机会 看好真空绝热板、具身智能与固态电池设备产业
智通财经网· 2025-12-23 04:00
智通财经APP获悉,信达证券发布研报称,聚焦政策抬升天花板与设备端"先行兑现"的投资机会。2026 年中小盘的机会可沿两条主线系统化挖掘:一是政策抬升行业天花板与交易结构优化带来的估值与基本 面双重重估;二是先进智造/新兴产业的设备端在技术节点前后"订单—交付—现金流"加速兑现的先行 收益。筛选维度上,优先锁定政策有明确信号、并购落地路径清晰、打新收益改善的交易结构,以及在 固态电池、半导体设备、人形机器人/具身智能、AIDC配套等方向具备订单与量产验证的设备龙头与平 台化公司。 风险因素:宏观经济增速不及预期风险、行业竞争加剧风险、终端需求疲软风险、原材料价格上涨风 险、流动性与市场交易风险。 具身智能硬件:潜在技术突破有望抬升硬件需求强度 具身智能硬件是"智能体落地"的确定性主线,政策自上而下明确其为未来产业,产业链呈"上游基础支 撑—中游本体集成—下游场景服务"全栈协同,硬件环节与软件基础设施深度耦合,构成投资框架的底 盘。其中,端侧"双层控制器(AI决策SoC+实时运动控制)+场景化数据闭环"是工程化落地的标准路 径,该行认为2026年有望成为AI+机器人规模落地元年,硬件价值量与国产替代进程同步释放 ...
今年大概率产了n篇VLA+RL工作吧?!
自动驾驶之心· 2025-12-23 03:43
行业技术趋势:VLA与强化学习的融合 - 当前视觉-语言-行动模型在真实世界分布外场景中表现脆弱,仅依赖模仿学习缺乏失败恢复、自主探索与闭环纠错能力[2] - 强化学习被证明能显著提升VLA模型的泛化能力,实验显示在分布外任务上的性能提升可达42.6%[2] - 2024至2025年间,VLA+RL的研究方向产出大量论文,成为行业活跃领域,技术框架也在逐渐完善[2] 代表性研究方法与框架 - 基于世界模型的在线方案是活跃方向,例如使用世界模型和基于行动的偏好奖励进行训练的NORA-1.5模型[2][5] - 离线强化学习被广泛用于VLA模型的后期训练,以平衡信号与方差,并实现高效微调[5] - 工具方面,Rlinf等框架支持的方法越来越多,为VLA+RL训练提供了统一高效的平台[2][11] 近期重要研究成果(2025年) - 2025年11月,NORA-1.5、pi0.6、GR-RL、WMPO、RobustVLA、World-Env、ProphRL等多个工作取得惊艳效果[2][5][8][9] - 2025年10月,DeepThinkVLA、Self-Improving VLA with Data Generation via Residual RL、RLinf-VLA、VLA-RFT等工作发布,专注于增强推理能力、自我改进与在模拟器中的验证奖励微调[8][9][10][11] - 2025年9月及之前,CO-RFT、ReinboT、VLA-Critic、Self-Improving Embodied Foundation Models、Dual-Actor Fine-Tuning、SimpleVLA-RL等工作陆续被会议收录,涉及分块离线强化学习、策略提炼、人机交互等多种方法[5][10][11][12] 早期与中期关键工作(2023-2024年) - 2023年10月,Q-Transformer通过自回归Q函数实现了可扩展的离线强化学习,为后续研究奠定基础[8][9] - 2024年2月,Perceiver Actor-Critic工作发布[7] - 2024年9月至12月,FLaRe、Policy Agnostic RL、RLDG、GRAPE等工作聚焦于大规模强化学习微调、策略无关的RL以及通过偏好对齐实现策略泛化[17][19] 技术细分方向 - **安全与鲁棒性**:例如2025年3月的SafeVLA致力于通过约束学习实现VLA模型的安全对齐[16][19] - **恢复与适应**:例如2025年6月的RLRC专注于基于强化学习的压缩VLA模型恢复,TGRPO通过轨迹组相对策略优化进行微调[13][14] - **实证研究**:例如2025年5月的“What Can RL Bring to VLA Generalization?”对强化学习提升VLA泛化能力进行了实证研究[13][14]
当科技投资进入深水区,投资的策略与机会该如何调整?|甲子引力
搜狐财经· 2025-12-23 03:40
文章核心观点 - 科技投资的主基调正从追求爆发式增长的“风口”时代,转向需要更深产业理解和专业判断的“深水区”时代 [2] - “深水区”意味着投资机会存在于技术更复杂、周期更长、但潜在回报更丰厚的硬科技和前沿领域,如人工智能、商业航天、先进制造等 [2][13] - 面对新范式,投资机构需调整方法论,包括构建深度产业认知、保持开放学习心态、优化决策流程,并需要“耐心资本”支持长周期项目 [20][21][39] 投资机构概况与布局 - **光合创投**:深耕中国科技领域15年,系统化布局硬科技,代表项目包括市值6000亿的中际旭创、宇树科技、沐曦、禾赛科技等 [6] - **达晨财智**:成立于2000年,投资近800家企业,上市约150家,近年重点关注AI方向 [6] - **普华资本**:成立于2004年,管理资产规模数百亿,重点布局半导体、新能源、空天海、人工智能,投资了云从科技、沐曦、壁仞、长光卫星等 [6][7] - **新鼎资本**:成立于2015年,专注硬科技,累计投资约130亿元覆盖约100个项目,22个已上市,核心赛道为集成电路、商业航天、人工智能、新能源汽车和生物医药 [7] - **华映资本**:成立于2008年,管理规模超130亿人民币,从消费转向综合性基金并以科技为主力,布局AI、具身智能、智能制造、新能源、半导体、航空航天、量子计算等前沿领域 [8][9] - **毅达资本**:管理资产规模超过1200亿元,投资近1000家公司,近年成立“未来天使基金”向早期阶段拓展 [11] 新兴投资机会方向 - **人工智能(AI)**:被视为驱动未来社会发展的核心,机会贯穿模型层、基础设施(Infra)和应用层,当前阶段应用层机会受关注 [12][29] - **商业航天与卫星互联网**:被视为未来四五年内明确可见、能带动万亿规模产业链的领域,投资覆盖火箭、卫星、运营及上游供应链 [8][15][16] - **能源变革**:未来十到十五年明确的大趋势,包括更清洁、高效、不受约束的能源供给形式,与AI算力发展需求高度绑定 [16] - **上游材料与核心器件**:AI发展对性能的极致要求倒逼上游新材料升级(如散热材料、高速光通信材料),同时AI也重塑了材料研发范式 [17] - **具身智能与人形机器人**:是AI范畴内的热点,本体公司估值已达五六十亿,后续“大脑”及空间大模型公司成为新机会 [15][29] - **其他前沿领域**:包括量子计算、可控核聚变、深地深海等,代表向“星辰大海”的探索 [9][20] 投资方法论与能力调整 - **构建深度产业认知**:需真正摸清赛道,避免被市场热度裹挟,可借助已投的链主企业及产业链资源观察真实技术进展与需求 [21] - **保持开放与快速学习**:机构需具备持续适应变化的能力,以开放心态加速学习新兴事物,并压缩决策流程以应对热点项目估值的快速上涨 [22][23] - **利用AI赋能机构自身**:投资机构需基于AI进行知识体系与决策体系的重构,以提升信息获取和学习效率,适应更快的决策节奏 [26] - **整合上下游信息进行判断**:通过整合上游科学家、研究院所与下游产业巨头、市场端的需求信息,形成投资决策的“算法”模型 [27] - **调整决策机制**:例如设立成员更少、更聚焦的专门投资委员会(IC),以加快决策速度并使讨论迅速收敛 [30][32] 对市场热度与泡沫的认知 - **AI是广泛且长期的浪潮**:类比PC互联网,其产业覆盖范围广、周期长,模型、基础设施和应用均存在巨大空间,当前热度有其合理性 [30] - **理性看待泡沫周期**:科技发展常经历“高估短期、低估长期”的泡沫周期,投资机构需对短期波动保持平和,对长期趋势保持乐观 [34] - **在泡沫中保持清醒**:坚持“宁可错过,不能投错”的原则,避免追逐估值在短期内翻数倍的项目,投资核心回归到对团队(人)的判断 [36][37][40] - **机会不局限于单一热点**:中国在制造业、新能源、基础材料等领域蕴含更多机会,不应因AI和具身智能的热度而忽视其他基础性进步 [35] 科技投资的特有风险与应对 - **技术与时间周期风险**:硬科技不确定性高、研发迭代周期长(如芯片以一两年计,核聚变以数十年计),需要“耐心资本”支持 [38][39] - **商业转化风险**:技术背景出身的创始人在商业运作上可能相对薄弱,存在从科技工作者向企业家转型的风险,需为其匹配商业运营人才 [41][42] - **产能过剩与商业模式风险**:中国产业化容易导致过剩,需观察赛道过剩潜力;同时需警惕“流沙陷阱”式的项目,即持续高投入但产出微薄,应重视商业模式的健康度 [43][44] 对科技企业创始人的投资与赋能 - **评估创始人潜力**:并非所有科学家都需要转型为企业家,关键是根据行业需求评估创始人是否具备角色转换的潜力或能否找到合适的商业搭档 [46][47] - **协助明确资本路径**:对于缺乏资本意识的创始人,投后工作的重要部分是帮助其理解估值成长和上市等退出路径的重要性,甚至协助引入专业管理人才 [52][53] 退出策略 - **以IPO为主要退出方式**:对于中后期项目,IPO退出占比约80%,需根据项目质量(分为A、B、C、D类)投入差异化的投后管理精力 [52] - **重视投后管理与引导**:大量精力需用于督促和推动缺乏资本意识的企业启动上市流程,以及处理表现不佳项目的退出 [52] “深水区”投资的变革 - **需要“耐心”与“沉心”**:投资机构自身需转变为“耐心机构”,安静下来深耕行业,进行长远布局 [53] - **“胆大心细”与“如履薄冰”**:对新兴事物保持开放和胆大,但在具体投资时审慎筛选,同时始终对投资结果的两极分化保持警惕 [53] - **技术颠覆速度空前**:以Transformer为代表的AI技术正以超乎想象的速度推动社会进步,带来前所未有的行业颠覆 [54] - **持续学习与长期主义**:科技投资要求像学生一样持续学习提升认知,并坚持长期思维耐心筛选 [54]
首个长程「VLA-World Model」一体化模型!ManualVLA解锁长程精细操作任务
具身智能之心· 2025-12-23 03:34
文章核心观点 - 北京大学、香港中文大学与至简动力团队提出了一种名为ManualVLA的新型“生成-理解-动作”一体化模型,旨在解决现有视觉-语言-动作模型在需要明确目标终态的长时序任务中难以兼顾高层规划与精细操控的挑战 [2][5] - 该模型摒弃了传统分层级联方案,构建了全新的Mixture-of-Transformers通用基础模型架构,通过“规划专家”生成多模态操作说明书,并结合显式与隐式“思维链”推理来指导“动作专家”执行,实现了理解与生成的高度统一 [5] - 实验结果表明,ManualVLA在现实场景任务中的平均成功率相较于分层结构的最新基线方法提升约32%,验证了其统一范式的有效性 [5] 研究背景与挑战 - 当前VLA模型在需要精确定义最终目标状态的长周期任务中面临核心难题:必须执行精确操作以严格对齐预定义的最终场景,并有效集成长周期规划与细粒度控制,同时保持对多样化现实世界环境的泛化能力 [7] - 现有的分层方法依赖人工制作说明书或人类演示视频,在泛化到未见过的最终目标状态方面存在局限性,难以在系统复杂度、部署成本和泛化性之间取得平衡 [9] ManualVLA方法陈述 - ManualVLA的核心思想是让模型学会自己生成说明书,再按说明书执行动作 [12] - 在推理阶段,系统接收自然语言指令、当前场景图像和最终目标图像,由“规划专家”生成包含文字描述、像素级坐标和子目标图像的多模态手册,将长时序任务拆解为一系列可控的短阶段 [12] - 模型架构基于Janus-Pro 1B拓展到MoT架构,集成了“规划专家”和“动作专家” [15] - ManualCoT思维链机制通过显式与隐式两条路径影响动作生成:显式路径将目标位置以visual prompt形式叠加在图像上;隐式路径将手册生成时的内部特征通过注意力掩码传递给动作专家 [16][19][20] - 规划专家采用基于VQ的视觉分词器对子目标图像进行离散化建模;动作专家采用基于扩散去噪的方法进行动作建模,并使用SigLIP-large从384×384输入图像中提取高维语义特征 [19] 真机、模拟器、泛化性实验 - **真机实验**:在Franka双臂平台上测试了2D乐高组装、3D乐高组装和物体重新排列三个长周期任务 [23] - 规划专家在300个未见过的测试样本上生成了高质量的中间图像,例如2D乐高组装的PSNR达29.01,物体重新排列的FID分数为24.46,2D乐高组装的MAE分数为3.23 [23][27] - ManualVLA在所有三个任务中均取得了最高成功率,相比最强的分层基线,最终任务完成率提高了15%到30%,平均成功率高出32% [28] - **仿真实验**:在RLBench的10个仿真任务上取得了70%的平均成功率,超越了SOTA方法π0的63% [31][32] - **消融与泛化实验**:证明说明书中所有模态信息和隐式CoT推理对于解决长周期任务不可或缺,且模型在未见过的背景、物体形状和光照变化下表现出鲁棒的泛化能力 [33][36]
VLA+RL技术交流群来啦~
具身智能之心· 2025-12-23 03:34
行业技术动态 - 行业正在积极组建围绕视觉语言动作模型的技术交流社群,社群关注方向包括VLA模型本身、VLA与强化学习的结合以及模型的轻量化与部署 [1]
看了这么多开源项目,推荐复现这几个VLA方法~
具身智能之心· 2025-12-23 03:34
行业技术趋势与人才需求 - 视觉语言动作模型是当前具身智能领域最急需的技术方向之一 这一点在大量职位需求和论文产出上得到体现 [1] - 行业面临的核心挑战在于VLA模型难以调试 数据采集过程复杂且耗时 导致研发效率低下 [2][3] - 近两年来 VLA技术发展迅速 从ACT到OpenVLA、GR00T 再到π0、π0.5、π0.6等新方法层出不穷 性能持续提升 基于强化学习的优化方案使模型表现更佳 [5] 技术研发与落地瓶颈 - 具身智能领域高度依赖硬件本体 算法效果与真机实验强相关 仅靠仿真难以保证泛化性能 许多公司坚持采用真机数据路线 [3] - 从数据采集、模型训练优化到最终部署的全流程打通对初学者而言非常困难 部分从业者甚至花费半年时间仍难以入门并取得良好效果 [8] - 在模型训练环节 仿真和Sim2Real技术至关重要 特别是在真机数据不足时 训练技巧是关键 不同算法难度差异大 例如ACT相对简单易出效果 而π0和π0.5等模型则对细节和技巧要求极高 难以训练成功 [11] - 模型部署面临参数量大的挑战 即使是2B规模的模型 在边缘芯片上部署也有很大难度 因此量化、蒸馏等轻量化操作必不可少 [12] 主流技术方案与开源生态 - 行业内已有如LeRobot等开源技术框架 非常适合入门学习 [5] - 开源机器人本体种类多样 能满足不同研究需求 例如SO-100机械臂、OpenArm双臂操作系统以及XLeRobot移动操作平台等 [6] - 数据采集主要基于模仿学习和强化学习 模仿学习的方法包括遥操作、VR和全身动作捕捉 在机械臂结合VLA的领域 前两种方法更为常用 [10] 专业培训与能力建设 - 为应对技术快速更新和学习困难 业内推出了面向实战的VLA系统课程 课程内容全面覆盖机械臂硬件、数据采集、VLA算法、评测、仿真、模型部署、世界模型融合、真机实验及产业分析 [13][17] - 该课程是目前内容最完整的具身智能课程之一 采用软硬结合的方式 购买课程者将获赠一套包含示教臂和执行臂的SO-100机械臂硬件 [18][29] - 课程面向多类人群 包括正在求职的学生、需要进阶的VLA从业者、从事研究的博硕士生 以及希望从传统计算机视觉、机器人或自动驾驶领域转型至具身智能的人员 [33][36] - 完成课程学习后 学员预期能掌握真机调试与数据采集 掌握各类VLA算法在真机上的部署 对模型量化有深入了解 并对产业落地有清晰认识 简历项目经验可达到1-2年以上算法工程师水平 [36][39]
银河通用机器人牵手百达精工 计划部署超1000台具身智能机器人
新浪财经· 2025-12-23 03:34
格隆汇12月23日|银河通用机器人宣布与百达精工达成战略合作,双方将围绕工业精密制造开展具身智 能机器人规模化深度应用,在百达精工及其生态体系内部署超1000台银河通用机器人,银河通用也将引 入百达精工在核心零部件领域的技术成果。 ...
银河通用机器人牵手百达精工,计划部署超1000台具身智能机器人
新浪财经· 2025-12-23 03:24
银河通用机器人宣布与百达精工达成战略合作,双方将围绕工业精密制造开展具身智能机器人规模化深 度应用,在百达精工及其生态体系内部署超1000台银河通用机器人,银河通用也将引入百达精工在核心 零部件领域的技术成果。 ...
中国人民大学深圳论坛:院士共论科技革命与新质生产力发展之道
证券时报· 2025-12-23 03:22
12月20日,中国人民大学深圳论坛在深圳市宝安区九围国际总部会议中心隆重开幕。在"院士对话:科 技革命与新质生产力"环节,来自高校、科研院所、智库机构的多位顶尖专家学者齐聚一堂,围绕空天 信息、柔性电子、人工智能、市场经济体制、现代金融等关键领域,展开深度研讨,为科技赋能新质生 产力、助力中国式现代化建言献策。 中国工程院院士、武汉大学原校长刘经南聚焦"十五五"规划建议中的战略性新兴产业与未来产业发展。 他指出,中央"十五五"规划建议明确支持空天信息、数字经济、人工智能、生物医药等产业发展,为新 质生产力生成按下"加速键"。未来空天信息产业将重点攻关深空、深海、深地、深网领域核心技术,研 发载人航天、探月探火、卫星导航等关键装备,推进海洋资源探测与深海智能无人平台发展。他强调, 空天信息技术构建的体系化、智能化数字底座是新型信息基础设施核心,必须牢牢掌握时空基准控制权 与信息化、智能化发展主导权,力争2035年前建成更泛在、更融合、更智能的综合时空体系,服务国家 战略需求。 国家一级教授、中央党校(国家行政学院)中国式现代化研究中心主任张占斌提出"全面建成高水平社 会主义市场经济体制具有紧迫性"的核心观点。他 ...
日薪300,我在后厂村“手搓”人形机器人
创业邦· 2025-12-23 03:12
以下文章来源于刺猬公社 ,作者刺猬公社编辑部 刺猬公社 . 互联网内容行业观察与研究 来源丨刺猬公社(ID: ciweigongshe ) 作者丨 园长 编辑丨 陈梅希 图源丨Midjourney 北京后厂村,距离"互联网十字路口"不远的某座写字楼里,一间教室大小的房间内,几十个工人分成 两批,一组在桌上用螺丝刀和扳手拼装轴承模组,一组在旁边的测试区,用示波器和万用表对已经组 装好的总成做检测。 这不是什么小作坊,而是 2025 年的科技创业风口——人形机器人产业的生产环节。 从咖啡到汽车,我参观过各行各业数不清的智能工厂,通常是产品科技含量越高,需要人手工操作的 环节越少,流水线越标准规范,工人和流水线几乎融为一体。以此类推,创造"具身智能"的地方应该 充满了各种黑科技。 但情况并不是我事先想象的那样, 这里没有流水线,也没有除了金属工件冷冻机之外的大型设备,组 装规范全靠人手一本翻到起毛边的 A4 纸手册 ...... 它更像一间大学里自动化专业的实验室,或者一个忙忙碌碌的家电维修部。为了看看当前的机器人产 业究竟发展到什么程度,我报名了某个具身智能企业的外包兼职,本意是想在流水线上,看清这个行 业的冰山 ...