Workflow
SmolVLA
icon
搜索文档
AnywhereVLA:在消费级硬件上实时运行VLA
具身智能之心· 2025-09-29 02:08
点击下方 卡片 ,关注" 具身智能 之心 "公众号 作者丨 Artem Voronov等 编辑丨具身智能之心 本文只做学术分享,如有侵权,联系删文 >> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 一、核心背景与目标 当前移动操作技术正从封闭、结构化的工作单元,向开放、非结构化的大型室内环境拓展——机器人需在陌生杂乱空间中探索,与多样物体及人类互动,同时响 应自然语言指令完成任务(如家庭服务、零售自动化、仓储物流等场景)。但现有方案存在明显瓶颈: 为此,AnywhereVLA提出模块化架构,核心是融合经典导航的鲁棒性与VLA模型的语义理解能力,实现 未知大型室内环境下的语言驱动拾取-放置任务 ,且能在 消费级硬件上实时运行。 二、相关工作回顾:现有方案的优势与不足 1. VLA模型与轻量化优化 2. 扩散Transformer与导航相关方案 三、AnywhereVLA架构:四大核心模块与工作流 AnywhereVLA以自然语言指令为输入,通过四大模块协同输出低级别控制指令(驱动基座车轮与机械臂关节),整体 ...
VLA-Adapter:以0.5B参数实现机器人智能新高度,还无需预训练
具身智能之心· 2025-09-17 03:14
>> 点击进入→ 具身智能之心 技术交流群 更多干货,欢迎加入国内首个具身智能全栈学习社区 : 具身智能之心知识星球 (戳我) , 这里包含所有你想要的。 点击下方 卡片 ,关注" 具身智能之心 "公众号 | | OpenVLA-OFT (soTA) | | VLA-Adapter (Ours) | | --- | --- | --- | --- | | Backbone ↓ | 7B | 0.5в | 1/14× | | Fine-tuning Cost ↓ | 304GPU·h | 8GPU.h | 1/38× | | Training VRAM (8 batch)↓ | 62GB | 24.7GB | 0.4× | | Throughput (8-dim chunk) ↑ | 71.4Hz | 219.2Hz | 3× | | Performance (LIBERO) ↑ | 97.1% | 97.3% | Maintain | | VLM # / 3 | Bridge | Policy | Frozen | | | | | ు Trainable | | / IRGB L Instuction | A ...
GPT重大更新,Hugging Face发布开源机器人AI模型
每日经济新闻· 2025-06-05 00:57
市场表现 - 科创人工智能ETF华夏(589010)上涨0.2%,持仓股中奥普特领涨4.65%,有方科技上涨2.96%,金山办公上涨2.72% [1] - 机器人ETF(562500)上涨0.6%,持仓股中亿嘉和领涨5.65%,奥普特上涨4.65%,绿的谐波上涨4.61% [1] - 当日机器人ETF交易金额达4.41亿元,居同类ETF首位,换手率3.43%,市场成交活跃 [1] OpenAI动态 - OpenAI推出ChatGPT重大更新,包括macOS会议记录模式和MCP协议支持,实现跨平台数据整合与协作功能 [2] - OpenAI付费企业用户突破300万,较2月份200万增长50%,涵盖企业版、团队版和教育版客户 [2] - OpenAI预计2025年营收127亿美元,较去年9月预测的37亿美元大幅上调243% [2] 行业技术进展 - Hugging Face发布开源机器人AI模型SmolVLA,参数规模4.5亿,可在消费级GPU运行,异步推理堆栈提升环境响应速度 [3] 机构观点 - 广发证券指出AI板块调整3个月后具备反攻条件:TMT成交额占比回落至2023年区间下沿,融资余额处于年内底部 [4] - 6月密集的大厂发布会成色可能成为行情关键催化剂 [4] ETF产品特征 - 机器人ETF(562500)规模破百亿,覆盖中国机器人产业链最全,流动性最佳 [5] - 科创人工智能ETF华夏(589010)聚焦AI产业,具备20%涨跌幅和中小盘弹性特征 [5]