GroceryVLA大模型
搜索文档
瞭望 | 何时摆脱遥控器
新华社· 2025-11-18 03:06
行业现状与公众认知 - 中国具身智能行业通过机器人表演如扭秧歌、跑马拉松、打拳击等技能展示快速发展,但当前多数高难度动作依赖人类工程师遥操或预设程序,实际自主能力有限 [1] - 行业存在“表面繁荣”现象,公众可能误判机器人成熟度,其距离“全自主”和“无所不能”仍有差距 [1] 大脑技术核心突破 - 实现自主智能需突破三大核心技术:VLA大模型(视觉-语言-行动模型)、端到端强化学习和世界模型,三者协同完成感知-决策-执行闭环 [3] - 银河通用发布的GroceryVLA模型使机器人能在零售场景自主理解指令(如“帮我拿点吃的”),无需遥操或预采数据即可规划路径并抓取物品 [3] - 清华大学团队采用端到端强化学习算法,在2025世界人形机器人运动会足球赛中实现机器人无遥操,直接将视觉信号映射为运动控制指令 [4] - 智元发布的世界模型GE通过模拟物理规律和环境动态,让机器人具备“脑内推演”能力,主动预判决策,并已完成“做三明治”等任务,其开放架构或成机器人界“安卓系统” [4] 迈向通用智能的核心挑战 - 触觉融入是重大挑战,需在VLA模型基础上增加力度、材质、温度等多维度触觉感知,但数据元素过多导致模型体量增大和难度提升,例如他山科技研发剥小龙虾任务需大量训练 [5] - 硬件层面需发展低功耗、高性能的专用芯片,并将大参数模型轻量化、小型化以保证任务性能 [5] - 算法泛化能力不足,当前最先进模型在3D情景问答任务中准确率为55%~60%,远低于人类的90.06% [6] - 群体智能(多机器人协同)是待攻克课题,但部分场景技术突破乐观估计需三五年 [6] 分级标准与场景落地 - 借鉴智能驾驶分级,行业推出如《人形机器人分类分级应用指南》等标准,建立四维五级评价体系(感知、决策、执行、协作),以加速技术对齐和产品落地 [7][8] - 封闭场景(如工厂车间)因环境可控,适合高等级机器人执行高精度装配等复杂任务;开放场景不确定性高,可用低等级机器人进行引导服务等,逐步积累经验 [8]
21现场|机器人售货员 正在批量“上岗”
21世纪经济报道· 2025-11-14 09:35
银河通用机器人产品与业务 - 银河通用G1机器人在高交会展示无人零售店场景的自动取货与送货功能,消费者通过平板下单支付后,机器人执行取货并交付[1] - G1机器人搭载公司自主研发的全球首个聚焦零售场景的端到端大模型GroceryVLA,应用场景包括智慧医疗、工业分拣和迎宾接待[1] - 公司与美团合作,在药品分拣场景中,机器人可针对四五千款药品进行分拣并自动打包,在工业场景中可进行汽车零部件分拣,该机器人今年预计量产1000台[1] 相关ETF市场表现 - 食品饮料ETF(515170)近五日上涨2.99%,市盈率21.11倍,最新份额105.1亿份,增加3.4亿份,主力资金净流出2435.8万元,估值分位23.44%[3] - 游戏ETF(159869)近五日下跌2.76%,市盈率35.98倍,最新份额81.4亿份,减少500.0万份,主力资金净流出6239.5万元,估值分位52.53%[3] - 科创50ETF(588000)近五日下跌3.76%,市盈率152.75倍,最新份额502.2亿份,减少1.3亿份,主力资金净流出7.6亿元,估值分位95.65%[3] - 云计算50ETF(516630)近五日下跌4.93%,市盈率92.05倍,最新份额3.0亿份,主力资金净流出210.3万元,估值分位78.70%[3][4]
“人工智能场景化应用创新与产业落地论坛”在哈尔滨举行 多领域创新成果集中亮相
新华社· 2025-08-05 07:25
人工智能产业创新赋能底座 - 新华网发布"人工智能产业创新赋能底座2025第二批生态共创产品",覆盖信息服务、医疗、心理、教育、法务、应急管理等多个领域 [2] - 首批生态共创产品已于2024年3月发布,包含数据要素、智算统筹、应用使能、安全治理四大核心底座 [2] - 通过政产学研用深度融合的对话平台,探索技术创新驱动产业升级的有效路径 [1] 低空之瞳大模型 - 基于百亿参数Transformer架构,多模态融合低空行业专属数据,实时图像识别精准度达99%,风险预测精度达95% [4] - 云边协同架构降低能耗40%、部署成本30%,已应用于勘察、通信、物流、救援四大场景 [4] - 助力千亿级低空经济商业化进程,优化安防响应速度、通信安全性、配送时效、被困人员生存率等核心指标 [4] 新华智影AI智慧药学一体机 - 一站式覆盖18个药学服务场景,通过PC、APP、小程序等多端协同 [6] - 实现智慧药学监护、智能药历生成、智能用药咨询、库存效期管理、权威健康科普及增值健康服务 [6] - 面向医院、药师、患者、药店及医药企业,构建智慧药学新生态 [6] 新智AI心理健康促进平台 - 融合人工智能技术与专业心理学知识,提供个性化、全天候、多维度的心理健康支持服务 [8] - 基于"身心一体化"理论及多模态AI识别技术,构建AI个人特质多维模型和优势发展图谱 [8] - 服务学生、职场、老年、军警等多类人群,形成筛查预警、AI干预、智慧陪伴的完整生态 [8] 法院悬赏公告平台 - 依托"数据库+大模型",提升司法信息公告的"全流程、多渠道、强普及"服务能力 [10] - 为律师等从业人员提供智能化服务,响应各地法院执行庭等司法系统单位需求 [10] 数农时代·产业生态共同体 - 以"数智赋能、数据增值"为双核驱动,整合技术方案异地验证、优质农产品跨域流通、数据资产全国评估流转及人才智慧协同创新 [12] - 构建覆盖全国的协作网络,为农业新质生产力落地提供"加速器" [12] DataMind数据智能决策中枢 - 打造智能化数据治理、多模态数据加工、自动化语料构建、数据服务管理与开发、数据资产超市、数据智能应用六大核心能力 [14] - 为央国企提供全栈式、场景化的数智化转型产品和服务 [14] 幸福实验室智能一体机 - 融合大模型、智能体、实时交互数字人等前沿技术,构建"线下智能交互+线上综合服务"的创新生态 [16] - 整合博物馆、科技馆、科普内容、标签化影视素材库等高质量资源,打造覆盖德育、美育、文博、科普的沉浸式学习场景 [16] AI智慧法务资源调度平台 - 部署法律服务专属大模型,实现法务智能问答、文书起草、合同审查、法院公告信息大数据比对、诉讼案件预测等模块功能 [18] - 基于数据分析匹配专业对口律师团队,建立三方监管机制和严格服务品控体系 [18] 教育智能体平台 - 以"AI管家、AI学伴、AI助教"三大智能体为核心,为备课、授课、作业、评价等教学环节提供AI服务 [20] X-Data人工智能数据操作系统 - 实现复杂数据AI-Ready治理,提供通用和专用融合模型,构建新一代决策智能框架 [23] 产业合作与签约 - 新华网与广州市五行生文化创意有限公司就"数字科技文创园"项目达成合作 [25][27] - 新华网与浙江九频道生产力传媒有限公司就"产融圈"项目达成合作 [27] 行业趋势与专家观点 - 人工智能竞争焦点正从"算力竞赛"转向"数据决胜",高质量数据是比算力更稀缺的战略资源 [34] - 具身大模型机器人Galbot实现"零样本"泛化,在药房、商超、工厂等环境自主工作 [36] - "数字睡眠"生态以智能床为核心,联动数字药品、数字疗法和脑机接口,构建"十五分钟"数智健康服务圈 [39] - 人工智能正加速突破实验室藩篱,成为驱动产业升级与民生改善的重要引擎 [32]