世界模型
搜索文档
直播分享!“具身数据困境”:仿真技术、真实数据与世界模型的碰撞交融
具身智能之心· 2025-08-29 16:03
行业技术路径 - 具身智能发展主要围绕仿真技术、真实数据与世界模型三大路径展开 这些路径既存在竞争又相互融合 [3] - 物理仿真技术已进入深水区 真实数据到仿真的转换技术(real2sim)正推动仿真路线发展 [11] - 业界构建了超大规模训练场Agibot World 包含百万真机与千万仿真数据集 系统研究具imbing智能的Scaling Law方法论 [4] 核心技术突破 - 端到端自动驾驶方案UniAD获IEEE CVPR 2023最佳论文奖 其技术方案被特斯拉2023年推出的FSD采用 [4] - 开发全球首个开源模块化真实感自动驾驶仿真器MARS 并获得CICAI 2023最佳论文Runner-up奖项 [5] - 神经渲染方法SlimmeRF实现渲染阶段精度与速度的可调节 获得3DV 2024最佳论文奖 [5] - Open X-Embodiment项目获得ICRA 2024最佳论文奖 CAST项目获得SIGGRAPH 2025最佳论文奖 [7] 数据争议与解决方案 - 针对真实数据不可替代性的争论 行业探讨这是策略选择问题还是AI演进必经之路 [3][11] - Genie3世界模型的问世引发行业关注 世界引擎可能成为解决具身智能数据问题的终极方案 [11] - 俯视图感知方法BEVFormer成为业界广泛使用的纯视觉检测基准 入选2022年百强影响力AI论文榜单 [4] 学术与产业贡献 - 研究团队在CVPR/ICCV/ECCV/SIGGRAPH/NeurIPS/ICLR等顶级会议发表50余篇论文 多次获得最佳论文奖项 [5][7] - 学术成果获得多项荣誉包括2024年中国吴文俊人工智能青年科技奖 香港博士政府奖学金等 [4][7] - 构建的具身智能训练场包含百万级真机与千万级仿真数据集 为行业提供大规模训练基础设施 [4]
拆解华为乾崑智驾ADS 4:世界模型乱战,尖子生如何闯关?
21世纪经济报道· 2025-08-29 13:53
智能驾驶技术演进 - 行业从依赖算力和规则驱动转向端到端模型 但传统端到端模型仅模仿人类驾驶行为 无法真正理解物理规律 [6] - 世界模型成为自动驾驶新方向 通过多模态数据融合和物理世界推演 实现预判与决策 而非单纯反应 [2][8] - 华为乾崑ADS 4系统于2025年4月发布 9月将量产上车 标志世界模型进入落地阶段 [3][4][9] 华为乾崑技术架构与优势 - 自研WEWA架构包含云端世界引擎(WE)和车端世界行为模型(WA) WE专注生成极端场景 WA实现实时推理与拟人化决策 [3][12][13] - 云端WE通过自研生成式模型创造高价值Corner Case(如突然横穿的行人) 并通过奖惩函数训练模型安全合规行为 [13][14] - 车端WA直接通过多模态信号(视觉、声音等)控车 专为驾驶优化 避免语言模型缺乏空间感知的缺陷 [10][14] - 智驾系统搭载量突破100万辆 覆盖11家车企28款车型 新车型匹配周期缩短至6-9个月 [15] 市场竞争与行业动态 - 2024年华为乾崑在国内三方前装辅助驾驶域控全栈软硬一体方案市场中占据79.0%份额 稳居第一 [9] - 特斯拉在CVPR2023展示世界模型研究 蔚来2024年发布自研NWM模型 可在100毫秒内推演216种场景 [11] - 小鹏采用云端大模型(LLM为骨干)与车端小模型协同 通过VLA路径将视觉信息转换为语言token再生成控制动作 [12] 技术路径对比 - 端到端模型依赖大规模真实数据 但可能模仿人类驾驶缺陷(如90%保守行为导致系统犹豫) 泛化能力存在天花板 [6][7] - VLA路径引入语言模型 擅长语义理解但缺乏三维空间精确感知 华为明确拒绝此路径 [10] - 世界模型通过融合深度学习与思维链推理 自主生成行为链 突破长逻辑局限 提升复杂环境判断能力 [8]
拆解华为乾崑智驾ADS 4:世界模型乱战,“尖子生”如何闯关?
21世纪经济报道· 2025-08-29 10:42
智能驾驶技术演进 - 行业从依赖算力、规则驱动转向端到端模型 但仍面临根本挑战 端到端模型本质是模仿人类驾驶行为 而非真正理解物理世界 导致系统可能继承人类驾驶缺陷如犹豫和保守 [6] - 2024年行业在特斯拉技术路线催化下集体驶向端到端 但随后意识到其局限性 包括无法超越训练数据品质与分布 泛化能力存在天花板 [6][7][10] - 2025年行业开始探索新路径 包括彻底抛弃模块化的端到端方案 引入视觉语言模型VLA/VLM 或加入世界模型以理解物理世界运行机制 [10] 世界模型核心价值 - 世界模型通过超大规模融合多模态数据 包括数百万公里真实路况、仿真场景与交通规则 构建动态可推理的数字化交通世界 使车辆能预测和推演而不仅是感知当下 [2] - 世界模型解决端到端模型只会模仿不会思考的瓶颈 让AI理解驾驶环境、预测未来变化并自主生成合理行为链 融合深度学习与思维链CoT推理框架 [11] - 世界模型突破训练数据稀缺和质量不均问题 打开模型能力天花板 提升复杂环境中的判断能力 [11][12] 华为乾崑技术布局 - 华为乾崑2025年4月发布基于世界模型的ADS 4系统 依托自研WEWA架构 包含云端世界引擎WE负责海量数据训练与场景生成 车端世界行为模型WA实现实时环境推理与拟人化决策 [4][19] - 华为乾崑智驾ADS 4系统将于2025年9月陆续上车 标志高阶辅助驾驶进入新阶段 系统开始理解物理规律本身而非仅学习人类驾驶行为 [4] - 华为乾崑在国内三方前装辅助驾驶域控全栈软硬一体方案市场中以79.0%的绝对市场份额稳居第一 [12] 华为技术路径差异化 - 华为乾崑拒绝VLA视觉语言模型路径 认为其缺乏对三维空间的精确感知与运动推演能力 选择专为智能驾驶而生的世界行为模型WA 直接通过多模态信息输入控车 [12][14][22] - 华为云端世界引擎WE专注生成极端场景和Corner Case 如突然横穿的行人、暴雨中的滚动障碍物 并通过严格算法校验确保合成场景符合真实世界物理 [21] - 华为车端世界行为模型WA从零开始训练 专为安全行驶设计 融合多模态感知信号实现实时推理 不依赖语言中介 更专注空间推理 [19][22][23] 行业竞争格局 - 除华为外 蔚来2024年发布中国首个智能驾驶世界模型NWM 具备多模态自回归特性 能在100毫秒内推演出216种可能场景/轨迹 [18] - 小鹏采用云端大模型和车端小模型并进路径 云端大模型以LLM为骨干 通过VLA路径将视觉信息转换为语言token进行训练 [19] - 特斯拉在2023年CVPR上展示世界模型研究动态 推崇扩散模型diffusion 但研发尚处于初期 [17] 华为规模化优势 - 华为乾崑智驾系统搭载量已突破100万辆 覆盖11家车企、28款车型 包括东风、长安、广汽、北汽、比亚迪、赛力斯等品牌 [24] - 百万量级智能车队实时反馈复杂场景 数据持续流向云端 通过世界引擎WE筛选和增强 生成有效训练场景 推动模型迭代 形成感知-云端训练-车端进化的自主进化闭环 [25] - 华为乾崑智驾方案匹配一款车型最快仅需6至9个月 加速规模化落地 为L3及以上级别自动驾驶做准备 [24][25]
极佳视界完成Pre-A&Pre-A+两轮数亿元融资,以世界模型加速“物理世界ChatGPT时刻”到来
36氪· 2025-08-28 08:21
融资情况 - 极佳视界完成Pre-A和Pre-A+连续两轮数亿元融资 Pre-A轮由国中资本领投 紫峰资本 PKSHA Algorithm Fund跟投 Pre-A+轮由中金资本 广州产投 一村淞灵 华强资本投资 [2] - 2025年2月完成数千万天使++轮融资 由普超资本 合鼎共资本 上海天使会投资 [2] - 半年内完成连续三轮融资 体现资本市场对团队实力 技术路线和产品业务进展的认可 [2] - 此前已完成亿元级种子 天使 天使+多轮融资 [2] 公司定位与愿景 - 极佳视界是一家物理世界通用智能公司 成立于2023年6月 专注世界模型驱动的物理世界基础模型 加速走向物理世界通用智能 [2] - 公司产品包括世界模型平台GigaWorld(驾驶+具身) 具身基础模型GigaBrain 通用具身本体等Physical AI全栈系列产品 [2] - 愿景是服务于物理世界ChatGPT到来后家庭 服务等大众端巨大量级市场 [4] 技术方向与行业趋势 - 物理世界的ChatGPT时刻成为下一个备受关注的时刻 极佳视界认为世界模型+VLA+强化学习范式正在逐渐完备 2-3年内将迎来物理世界ChatGPT时刻 [3][4] - 物理世界ChatGPT时刻定义为在100种常见任务中 90%的场景下达到95%的成功率 [4] - 海外头部科技公司如NVIDIA Google DeepMind World Labs等都在世界模型方向积极布局和快速突破 [4] - 世界模型是解决物理世界通用智能真机数据瓶颈的最佳方式 [4] 技术优势与产品进展 - 在世界模型和VLA大模型方向均处于全球一流水平 持续引领技术发展和产业落地 [5] - 2025年7月发布全球首个世界模型驱动的具身基础模型GigaBrain-0 Preview 是具有空间推理能力的双系统端到端VLA具身基础模型 [10] - GigaBrain-0在数据来源方面取得突破性进展 90%以上数据来自自研世界模型平台生成数据 不到10%来自真机实采数据 [10] - 在全球首次实现了柔性长程复杂操作的开放世界零样本泛化 [10] - 2025年9月将发布GigaBrain-0正式版 [11] - 在驾驶世界模型方向发表DriveDreamer系列代表性成果 全部被视觉和AI方向顶级会议收录 [13] - 在具身世界模型方向发表EmbodieDreamer RoboTransfer EmbodiedGen等代表性领先学术工作 [14] - 将于近期发布具身世界模型平台GigaWorld-0 [15] 团队实力 - 紧密依托清华大学自动化系智能视觉实验室 核心团队来自清华 中科院等知名院校顶尖研究人员 以及百度 微软 地平线等知名企业高管和产业专家 [6] - 核心团队发表人工智能顶级会议和期刊论文200余篇 主导获得数十个全球最具影响力人工智能比赛世界冠军 发布多个具有全球影响力的人工智能技术成果 [6] - CEO黄冠博士是清华大学自动化系博士 国家级创新领军人才 多次带领团队获得全球权威AI比赛世界冠军 发布多个全球知名AI成果 [7] - 首席科学家朱政博士拥有超过70篇视觉和AI方向顶会论文 超过16000次引用 是国内AI方向引用最高的青年科学家之一 [7] - 工程副总裁毛继明拥有超过16年的仿真/工程/数据/分布式架构方向经验 曾担任百度Apollo仿真和工程负责人 百度 赢彻等T10级别架构师 [7] - 产品副总裁孙韶言博士曾担任阿里云总监 地平线数据闭环产品线总经理 在物理世界超大规模数据闭环产品和架构方面拥有行业领先经验 [7] 商业化与产业合作 - 始终将商业量产落地放在第一位 率先实现了自动驾驶领域世界模型的大规模量产落地 在具身世界模型 具身大模型等方向实现广泛合作落地 [16] - 在驾驶世界模型方向与多家国内头部汽车主机厂 海外和合资头部汽车主机厂 AI芯片和Tier 1巨头等达成签约和量产合作 [16] - 在具身世界模型方向与多地人形机器人创新中心 实训场达成深度合作 打造全球领先的虚实结合训练场等全栈产品 [16] - 在具身VLA大模型方向与多家全球汽车行业巨头 头部具身本体公司等达成深度合作 共同探索具身智能在工业 服务 家庭等多个场景的落地 [16] 资金用途与竞争优势 - 融资资金主要用于技术产品研发和市场商务拓展 以及在客户交付上进行更多投入 [17] - 在算法优势之余 在数据 基础设施 产业落地等方面具备优势 多位一体地服务客户需求 [17] 资方观点 - 国中资本认为极佳视界是国内世界模型和具身智能方向的引领者 最早开始相关方向的技术布局和创新引领 快速实现了规模化的产业落地 [18] - 紫峰资本认为具身大模型是产业发展的关键 极佳视界团队拥有超过10年的物理AI经验 历经CV 自动驾驶等多个物理AI时代 持续作出全球领先的技术成果和实现大规模产业落地 [18] - 中金资本认为数据和模型是具身智能机器人发展的关键 极佳视界团队在具身智能的数据和模型都拥有领先的优势 [19] - 广州产投长期看好具身智能机器人未来广阔的市场空间 认为极佳视界的端到端VLA大模型在世界模型的加持下 在开放世界首次实现了柔性复杂长程操作的零样本泛化 [20] - 一村淞灵认为世界模型是语言模型之后下一个最本质的事情 极佳团队生成+重建联合优化范式以高斯泼溅为基础很有亮点 是国内最早开始系统布局世界模型的团队 并在多个应用方向快速实现了产业落地 [20] - 华强资本认为极佳视界在世界模型和VLA大模型方向都处于国内领先水平 看好团队在物理AI方向的技术深度 技术广度和产业经验上的全面优势 [21] - 普超资本认为极佳视界是国内空间智能和世界模型的引领者 最早进行技术布局和实现创新突破 并在驾驶 具身 内容等多个领域实现了规模化应用落地 [21]
自动驾驶之心业务合伙人招募来啦!模型部署/VLA/端到端方向~
自动驾驶之心· 2025-08-28 08:17
业务拓展计划 - 公司计划在国内外招募10名业务合伙人[2] - 合伙人将负责自动驾驶相关课程研发、论文辅导业务开发及硬件研发[2] 技术研究方向 - 重点招募方向包括大模型/多模态大模型、扩散模型、VLA、端到端自动驾驶[3] - 涵盖具身交互、联合预测、SLAM及3D目标检测领域专家[3] - 需要世界模型、闭环仿真3DGS、大模型部署与量化感知推理等专业人才[3] 人才资质要求 - 要求应聘者来自QS200以内高校且具有硕士及以上学历[4] - 优先考虑拥有顶会论文发表记录的候选人[4] 合作激励机制 - 提供自动驾驶行业资源共享包括求职、读博及出国留学推荐[5] - 设立丰厚的现金激励方案[5] - 开放创业项目合作与推荐机会[5]
极佳视界官宣数亿融资,以世界模型迈向“物理世界chatGPT时刻”
搜狐财经· 2025-08-28 07:29
融资情况 - 公司完成Pre-A和Pre-A+连续两轮数亿元融资 Pre-A轮由国中资本领投 紫峰资本和老股东PKSHA Algorithm Fund跟投 Pre-A+轮由中金资本 广州产投 一村淞灵 华强资本投资 [2] - 2025年2月公司完成数千万天使++轮融资 由普超资本 合鼎共资本 上海天使会投资 [2] - 公司半年内完成连续三轮融资 此前已完成亿元级种子 天使 天使+多轮融资 [2][3] 公司定位与技术愿景 - 公司为物理世界通用智能公司 成立于2023年6月 专注世界模型驱动的物理世界基础模型 [2] - 公司认为世界模型+VLA+强化学习范式正在逐渐完备 2-3年内将迎来物理世界ChatGPT时刻 定义为在100种常见任务中90%场景下达到95%成功率 [3][4] - 物理世界ChatGPT时刻将带来超于语言模型10至100倍的应用爆发 尤其是在家庭 服务等大众端 [4] 技术优势与产品布局 - 产品包括世界模型平台GigaWorld(驾驶+具身) 具身基础模型GigaBrain 通用具身本体等Physical AI全栈系列产品 [3] - 在世界模型方向 公司持续推动技术创新和产业落地 已与多个机器人 汽车主机厂等头部企业达成签约和量产合作 [5] - 在端到端VLA具身基础模型方向 公司拥有行业领先的真机效果 最优模型架构设计 最高数据利用效率 并已开始迈向量产落地 [5] - 2025年7月公司发布全球首个世界模型驱动的具身基础模型GigaBrain-0 Preview 为双系统端到端VLA模型 可处理柔性 双臂协同 开放互动 自主推理等长程复杂操作任务 [11] - GigaBrain-0的90%以上数据来自自研世界模型平台生成数据 不到10%来自真机实采数据 实现开放世界柔性长程复杂操作的零样本泛化 [11] - 公司将于2025年9月发布GigaBrain-0正式版 [12] - 在驾驶世界模型方向 公司发表DriveDreamer系列成果 全部被视觉和AI方向顶级会议收录 [14] - 在具身世界模型方向 公司发表EmbodieDreamer RoboTransfer EmbodiedGen等代表性领先学术工作 [15] - 公司将于近期发布具身世界模型平台GigaWorld-0 [16] 团队实力 - 核心团队来自清华 中科院等知名院校顶尖研究人员 以及百度 微软 地平线等知名企业高管和产业专家 [6] - 团队发表人工智能顶级会议和期刊论文200余篇 主导获得数十个全球最具影响力人工智能比赛世界冠军 [6] - CEO黄冠博士为清华大学自动化系博士 国家级创新领军人才 多次带领团队获得全球权威AI比赛世界冠军 拥有微软 三星 地平线等企业研究经历 累计主导或参与融资超10亿元 [7] - 首席科学家朱政博士拥有超过70篇视觉和AI方向顶会论文 超过16000次引用 [8] - 工程副总裁毛继明拥有超过16年仿真/工程/数据/分布式架构经验 曾担任百度Apollo仿真和工程负责人 [8] - 产品副总裁孙韶言博士曾担任阿里云总监 地平线数据闭环产品线总经理 [8] 产业合作与商业化进展 - 公司已实现自动驾驶领域世界模型的大规模量产落地 并在具身世界模型 具身大模型等方向实现广泛合作落地 [17] - 在驾驶世界模型方向 与多家国内头部汽车主机厂 海外和合资头部汽车主机厂 AI芯片和Tier 1巨头等达成签约和量产合作 [17] - 在具身世界模型方向 与多地人形机器人创新中心 实训场达成深度合作 打造全球领先的虚实结合训练场 [17] - 在具身VLA大模型方向 与多家全球汽车行业巨头 头部具身本体公司等达成深度合作 共同探索工业 服务 家庭等场景落地 [17] - 融资资金将主要用于技术产品研发和市场商务拓展 以及在客户交付上进行更多投入 [18] 投资者观点 - 国中资本认为公司是国内世界模型和具身智能方向的引领者 最早开始技术布局并快速实现规模化产业落地 [18] - 紫峰资本认为公司团队拥有超过10年物理AI经验 历经CV 自动驾驶等多个时代 持续作出全球领先技术成果和实现大规模产业落地 [18] - 中金资本看好公司在具身智能数据和模型的领先优势 通过世界模型更本质解决数据和模型问题 [19] - 广州产投长期看好具身智能机器人市场空间 认为公司端到端VLA大模型在世界模型加持下实现开放世界零样本泛化 [20] - 一村淞灵认为世界模型是语言模型后最本质的事情 公司生成+重建联合优化范式以高斯泼溅为基础很有亮点 [20] - 华强资本看好公司在世界模型和VLA大模型的国内领先水平 以及技术深度 广度和产业经验的全面优势 [21] - 普超资本认为公司是国内空间智能和世界模型的引领者 在驾驶 具身 内容等多个领域实现规模化应用落地 [21]
极佳视界完成Pre-A&Pre-A+连续两轮数亿元融资
证券时报网· 2025-08-28 02:19
融资情况 - 公司完成Pre-A和Pre-A+连续两轮数亿元融资 Pre-A轮由国中资本领投 紫峰资本和老股东PKSHA Algorithm Fund跟投 Pre-A+轮由中金资本 广州产投 一村资本和华强资本投资 [1] - 2025年2月完成数千万天使++轮融资 由普超资本 合鼎共资本和上海天使会投资 [1] - 半年内完成连续三轮融资 [1] 公司背景与技术定位 - 公司成立于2023年6月 是一家物理世界通用智能公司 专注世界模型驱动的物理世界基础模型 [1] - 核心团队来自清华大学自动化系智能视觉实验室 成员包括清华 中国科学院等知名院校研究人员 以及百度 微软 地平线等企业高管和产业专家 [2] - CEO黄冠为清华大学自动化系博士 拥有微软 三星 地平线研究工作经历 累计主导或参与融资超10亿元 [2] - 产品包括世界模型平台GigaWorld(驾驶+具身) 具身基础模型GigaBrain和通用具身本体等Physical AI全栈系列产品 [1] 技术突破与产品进展 - 2025年7月发布全球首个世界模型驱动的具身基础模型GigaBrain-0Preview 解决具身智能数据瓶颈 [3] - GigaBrain-0是具有空间推理能力的双系统端到端VLA具身基础模型 实现柔性 双臂协同 开放互动和自主推理等长程复杂操作任务 [3] - 模型90%以上数据来自自研世界模型平台生成数据 不到10%来自真机实采数据 通过低成本实现极大泛化性 [3] - 全球首次实现柔性长程复杂操作的开放世界"零样本"泛化 [3] - 计划2025年9月发布具身世界模型平台GigaBrain-0正式版 [3] 行业合作与落地应用 - 驾驶世界模型方向与多家国内头部汽车主机厂 海外和合资头部汽车主机厂 AI芯片和Tier1巨头达成签约和量产合作 [4] - 具身世界模型方向与多地人形机器人创新中心 实训场达成深度合作 打造全球领先的虚实结合机器人训练场 [4] - 具身VLA大模型方向与多家全球汽车行业巨头 头部具身本体公司合作 探索工业 服务 家庭等场景落地 [4] 行业趋势与资本观点 - 行业认为"世界模型+VLA+强化学习"范式逐渐完备 2-3年内将迎来物理世界ChatGPT时刻 [2] - 海外头部科技公司如Nvidia Google-DeepMind World Labs均在世界模型方向积极布局 [3] - 中金资本认为数据和模型是具身智能机器人发展关键 公司团队在数据和模型方面拥有领先优势 [4] - 普超资本认为公司是国内空间智能和世界模型引领者 最早实现技术布局和创新突破 并在驾驶 具身 内容等多领域实现规模化应用落地 [5][6]
小马智行:一线城市全布局 深度合作整车厂商助力实现盈亏平衡
证券时报网· 2025-08-27 14:55
核心观点 - 公司作为全国唯一在北上广深四大一线城市同步开启无人驾驶出行服务的企业 实现深圳7×24小时无人驾驶服务常态化 并计划2025年底车队规模突破千辆以加速商业化闭环 [2] - 公司通过世界模型和远程协助系统实现安全性超人类近10倍 第七代自动驾驶车辆已量产下线200余台 海外市场在迪拜 首尔和卢森堡同步推进测试运营 [5][6][7] - 公司与丰田 北汽和广汽深度合作新一代车型 希望通过合作降低自动驾驶整车成本 助力实现盈亏平衡 [8] 国内业务进展 - 在深圳覆盖前海 南山 宝安核心商圈及深圳宝安机场 服务范围包括深圳湾口岸 2022年深圳成为全国首个推出自动驾驶地方立法的城市 [3] - 国内无人驾驶运营面积超过2000平方公里 2023年在广州 北京启动商业化运营 2024年在深圳获取商业化牌照 2025年在上海完成北上广深全覆盖布局 [4] - 深圳已开放7×24小时运营 凌晨时段有固定用户呼叫无人车 市民将其视作日常通勤工具 [3] 技术体系 - L4级自动驾驶被定义为自主智能体 无需人类接管 与L2辅助驾驶存在本质差异 [5] - 世界模型每周完成超100亿英里虚拟仿真里程 使系统安全性比普通人类提升10倍 [6] - 远程协助系统可实现一对多管控 1名协助员可同时监控多台车辆 降低对高速网络的依赖 [6] 产品与产能 - 第七代自动驾驶车辆与北汽极狐 广汽埃安合作研发 支持60万公里运营里程 成本大幅下降 外观与普通量产车接近 [7] - 2025年第七代车辆将在北上广深陆续部署 年底车队规模预计突破千辆 [2][7] 海外拓展 - 在阿联酋迪拜启动道路测试 在韩国首尔进入江南区开展测试运营 在欧洲卢森堡启动研发中心 [7] - 向海外监管部门分享中国在自动驾驶监管 牌照发放 商业化推进等方面的经验 目标帮助更多国家在2-3年内达到中国当前开放程度 [7] 行业合作与成本控制 - 与丰田 北汽和广汽合作开发丰田铂智4X Robotaxi 北汽极狐阿尔法T5 Robotaxi和广汽埃安霸王龙Robotaxi的自动驾驶套件 [8] - 通过与整车厂商深度合作降低自动驾驶整车成本 助力公司达到盈亏平衡点 [8] 行业竞争格局 - 通用汽车关停Cruise Robotaxi为行业敲响安全警钟 Waymo和特斯拉发展迅速 Waymo计划今年在美国落地数千台运营车辆 运营范围扩展至亚特兰大 迈阿密等多个城市 [9] - 美国政府高度重视境内自动驾驶发展 可能通过政策手段助力Waymo等巨头 通用汽车未来仍有可能重启L4级别Robotaxi [9]
人形机器人,缺一个杀手级共识
创业邦· 2025-08-26 03:37
公司技术路径与观点分野 - 星动纪元采用软硬一体、端到端VLA+强化学习+世界模型融合的垂直整合路线[8][30] - 宇树科技坚持硬件先行策略 通过自研关节电机和优化机械结构提升性能[10][31] - 双方对VLA可行性存在分歧:星动纪元认为端到端方法可行并投入研发ERA-42大模型[13][15] 宇树科技质疑其过度依赖数据且缺乏长期规划能力[16] 技术架构差异 - 星动纪元构建五层技术系统:硬件层(自研关节模组/灵巧手)[37] 实时控制层(混合传统控制与强化学习)[38] 感知与世界模型层(多模态融合)[38] VLA大模型决策层[39] 数据工程与训练平台层[40] - 宇树科技侧重硬件性能基础 关注模型决定数据与分布式算力工程实现[18][22] - 端到端架构优势:实现感知-决策-执行闭环 高频控制减少延迟[34][35] 商业化进展与策略 - 星动纪元已落地B端工业场景 产品达到70%人工效率 预计明年达90%[23] 累计交付超300台 服务全球市值前十科技公司中的9家[45] - 宇树科技采取多元化策略 现阶段聚焦表演与格斗比赛场景[26] 发布新品人形机器人R1及四足机器狗A2[27] - 星动纪元实现灵巧手量产 与VLA控制整合实现细粒度操作[44] 行业共识与发展阶段 - 共同认可人形机器人是AI终极载体 具身智能需感知-决策-执行闭环[50][52] - 短期(1-3年):工业场景小批量落地[56] - 中期(3-5年):迎来"ChatGPT时刻" 扩展至物流/医疗场景[56] - 长期(5-10年):进入家庭场景但需解决安全性问题[56] - 技术路径可能融合:VLA吸收世界模型预测能力 世界模型提升实时交互[56] 工程成果与行业影响 - 星动纪元L7以95.64cm成绩创人形机器人跳高世界纪录[4][43] - 开源Humanoid Gym框架与VPP大模型推动行业协作[21][45] - 行业需跨越软硬件协同瓶颈 硬件性能决定模型发挥上限[53][54]
中信证券:短期建议关注具身模型行业的资本布局者及数据采集卖铲人
第一财经· 2025-08-25 00:58
模型架构发展 - 大语言模型、大型视觉模型与动作模型融合是当前架构主旋律 [1] - 基于扩散模型的流匹配算法在短期逐渐占据主导地位 [1] 数据战略竞争 - 强资本开支企业以真实数据采集为突破口构建竞争壁垒 [1] - 合成数据及互联网数据因规模化与泛化属性成为重要价值底色 [1] - 数据样方理念持续兴起 预训练及后训练需与数据属性有机结合 [1] 技术赋能方向 - 世界模型对合成数据和策略评判具备规模化赋能潜力 [1] 投资关注重点 - 短期建议关注具身模型行业资本布局者及数据采集卖铲人 [1] - 长期维度建议关注云计算及算力提供者 [1]