Workflow
Vision-Language-Action(VLA)
icon
搜索文档
在看完近50篇VLA+RL工作之后......
具身智能之心· 2025-12-13 16:02
点击下方 卡片 ,关注" 具身智能 之心 "公众号 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 前面有同学向我们推荐了他们的repo,一直没来及整理,今天就带大家从近50篇VLA + RL工作上,看该领域的历程...... Offline RL-VLA Balancing Signal and Variance: Adaptive Offline RL Post-Training for VLA Flow Models CO-RFT: Efficient Fine-Tuning of Vision-Language-Action Models through Chunked Offline Reinforcement Learning 论文链接:https://arxiv.org/pdf/2509.04063 Date:2025.09 论文链接:https://arxiv.org/pdf/2508.02219 Date:2025.08 NORA-1.5: A V ...
具身智能机器人:2025商业元年底色兑现,2026量产元年基色明晰
格隆汇· 2025-11-28 02:07
文章核心观点 - 2025年是具身智能机器人商业化的关键节点,头部厂商已获得亿元级订单,行业总市值突破3万亿元 [1] - 在OEM、供应链及科技巨头的协同推进下,机器替代人力的效率提升、供应链产能布局及多维技术赋能正加速产业升级 [1] - 2026年产业重点在于特斯拉Optimus的量产预期、国产整机厂的资本化加速以及数据和算力规模效应带来的根本性突破 [3][4] 2025年具身智能机器人产业实际进展 - 整机厂方面,多家头部厂商已获得超亿元订单,优必选累计订单超8亿元,智元机器人累计订单超5.2亿元,应用率先落地于科研教育、文化娱乐及数据采集工厂领域 [1] - 供应链方面,为配合特斯拉2026年量产计划,中国供应商正积极布局泰国等海外产能枢纽,覆盖丝杠、轻量化部件等核心环节 [2] - 科技巨头方面,分化成两类路径:一类如华为对标英伟达模式,聚焦芯片、算力、模型等基础设施建设;另一类如美团、京东基于自身业务场景渗透Physical AI,通过构建平台生态竞争 [2] 2026年具身智能机器人产业重点方向展望 - 特斯拉预计2026Q1发布Optimus V3,马斯克薪酬激励计划的达成目标包括累计100万台人形机器人的交付,短期量产目标波动属合理范畴,建议聚焦机器替代人力的实际进展 [3] - 国产链应重点关注整机厂,港股市场已成为“聚集地”,在“18C章”政策支持下,优必选、越疆等企业已登录港交所,具身智能产业有望迎来千亿元级别市值的整机厂标的 [3] - 具身智能模型的根本性突破取决于数据与算力的规模效应,Vision-Language-Action模型性能随数据规模提升而增强,视频生成模型对算力需求持续增强,率先拥有数据和算力资源的玩家将掌握话语权 [4] 行业板块规模与投资主线 - 截至2025年10月,基于100家企业样本,板块整体市值预计已超3万亿元,行业分布上机械、汽车、电子占据主导地位,公司市值占比分别为26%、22%、22% [7] - 板块变化体现三大主线:市值规模投资主线从“大市值→小市值→大市值”回归;产业进展催生小范围主题型投资;国产链崛起加速 [7]
VLA/VLA+触觉/VLA+RL/具身世界模型等!国内首个具身大脑+小脑算法实战教程
具身智能之心· 2025-08-14 06:00
具身智能技术发展 - 具身智能强调智能体与物理环境的交互与适应,聚焦感知、理解、执行和反馈学习能力,其核心模块为大脑(语义理解与任务规划)和小脑(高精度运动执行)[1] - 技术演进分为四个阶段:从抓取位姿检测(静态物体单步决策)→行为克隆(端到端模仿但泛化弱)→Diffusion Policy(扩散模型提升时序稳定性)→VLA模型(多模态协同实现零样本泛化)[6][7] - 2025年技术前沿探索VLA与强化学习、世界模型、触觉感知的融合,以解决"理解不反馈"、"关注当下不预测未来"等局限[8] 产业竞争格局 - 国内企业以产业链投资驱动:华为2024年建"全球具身智能产业创新中心"联合乐聚机器人等;京东2025年连续投资智元机器人等强化物流与家庭服务场景;腾讯/蚂蚁/小米通过战略合作布局生态[5] - 海外企业侧重基础研发:Tesla/Figure AI推进工业物流机器人;Wayve/Apptronik获资本支持发展自动驾驶与仓储机器人;中美进入关键技术竞赛阶段[5] - 明星创业团队涌现:星海图、银河通用、逐际动力等从实验室走向商业化,推动本体与大小脑技术进步[3] 应用与商业化进展 - 技术落地产品涵盖人形机器人、机械臂、四足机器人,应用于工业、家居、餐饮、医疗康复等领域,融资与岗位呈爆发式增长[9] - 工程化需求激增:产业界要求从论文转向部署,需掌握Mujoco/IsaacGym等仿真平台训练、Diffusion Policy/VLA模型部署、强化学习微调等能力[24] 技术培训市场动态 - 课程体系覆盖全技术栈:包括具身仿真框架配置、Diffusion Policy/VLA/VLA+RL算法详解、触觉融合与世界模型等前沿内容[15][20] - 实践导向设计:每个模块配备实战代码(如DP3、SmolVLA)、大作业监督,目标使学员达到1-2年从业经验水平[20][30] - 受众定位明确:面向算法从业人员、转行者及在校生,要求具备Python/Pytorch基础及3090ti以上算力[13][30]