Workflow
VLA大模型
icon
搜索文档
一汽收购卓驭科技35.8%股权,后者前身为大疆车载事业部
第一财经· 2025-09-23 04:54
股权交易 - 一汽收购卓驭科技35.8%股权 交易后一汽与New Territory分别持股35.8%和34.85% 双方共同控制公司[1] - 交易前一汽未持股 New Territory持股70.65%并单独控制公司 交易后一汽成为最大单一股东[1] - 卓驭科技在交易后保持独立运营[1] 公司背景 - 卓驭科技前身为大疆车载事业部 2016年成立 2023年从大疆分拆独立 2024年6月启用卓驭品牌[2] - 公司属于"地大华魔"头部智驾企业之一 即华为/Momenta/地平线/大疆[2] - 2022年在宝骏KiWi EV(10万元级)量产首套辅助驾驶方案 实现自适应巡航/车道保持/拨杆变道/自主泊车等功能[2] - 2023-2024年在10万级车型实现无图高速领航与城市记忆领航[2] 业务现状 - 合作车企包括大众/上汽通用五菱/奇瑞/一汽/东风/长城 但未带来巨大规模和市场声量[2] - 2024年4月合作车企增至9家 新增比亚迪/奥迪/北汽 量产车型近20款 开发中新车型超30款[3] - 发布基于英伟达Thor平台的VLA大模型 该技术为行业前沿 理想/小鹏等企业也在押注此技术路线[3] 战略影响 - 股权深度绑定一汽有望加快量产落地速度[3] - 市场关注深度绑定一汽是否影响与其他车企合作[3]
中科院院士冷劲松:人形机器人的“身体”革命
经济观察报· 2025-09-20 09:55
具身智能产业发展路径 - 产业界存在两种不同发展路径:一种是以优必选、智平方为代表的企业聚焦人工智能大模型技术投入商业和工业场景 另一种是以冷劲松院士团队为代表的从底层智能材料入手重构机器人"身体"的路线 [1][3][18] "身体"革命:智能材料创新 - 冷劲松团队研发的智能材料可根据电、磁、光、热等外界激励主动改变形状、软硬和功能 目标替代传统电机成为未来机器人"肌肉" [2][10][11] - 智能材料柔性太阳能帆板已成功应用于商业卫星 实现国际首次作为主电源在轨展开 将传统"炸、弹、锁"三步展开流程简化为单一平稳动作 [5][7][8] - 智能材料在工业制造领域应用:新能源汽车碳纤维储氢气瓶制造中使用可变形模具 解决异形芯模取出难题 [9] - 生物医疗领域应用:可降解智能高分子材料制作心血管支架 两年后自行降解吸收 降低长期血栓风险 [10] - 其他应用场景包括:根据湿度变化的智能服装 自适应车速的汽车外形 自动升降的应急防洪坝 可重复擦写盲文纸 [10] "大脑"竞速:AI算法与感知系统 - 智平方与惠科子公司达成合作 未来三年将部署超过1000台VLA大模型驱动的具身智能机器人进入半导体显示生产基地 [2][14] - VLA大模型通过端到端数据驱动实现"从感知到行动"自主能力 解决传统机器人柔性作业难题 采用人形轮式设计适配现有工厂环境 [14] - 优必选获得2.5亿元具身智能人形机器人采购合同 为全球人形机器人领域最大合同 Walker系列累计获得近4亿元合同 [14][15] - 优必选百亿参数多模态大模型Thinker在微软、谷歌等机构发起的三大国际机器人权威测试中获得四项全球第一 [2][15] - 帕西尼公司聚焦触觉感知系统 自研高精度阵列式触觉传感器 建立具身智能数据采集工厂 [15] - 帕西尼全模态数据集"OmniSharing DB"在北京国际大数据交易所上架 成为可流通的标准数据资产 [15] 产业发展现状与挑战 - 中国在变形智能材料基础研究论文数量全球最多 但产品化方面可能在未来五到十年被日本和德国公司抢占先机 [16] - 产业面临共同挑战:如何将技术优势转化为具备成本效益和长期可靠性的商业化产品 [18]
理想、小鹏重金押注VLA大模型!“天才”还是“傻瓜”?
电动车公社· 2025-09-19 16:05
技术路线分化背景 - 特斯拉去年年初上线端到端后引发行业快速跟进 推动城市领航辅助功能普及 [3] - 当前辅助驾驶技术路线出现分化 主要形成VLA视觉语言动作模型和WA世界模型两条路径 [4][5] VLA技术路线代表企业 - 理想汽车全量推送VLA司机大模型 并宣称辅助驾驶从"局部领先"进入"全面领先" [7][8] - 小鹏汽车通过自研图灵芯片明确VLA路线 并强调"只有小鹏是真VLA" [12][13] - 奇瑞 吉利 元戎启行等企业也已明牌采用VLA技术路线 [15] WA技术路线代表企业 - 华为明确表示不会走VLA路径 认为WA才是实现真正自动驾驶的路径 [16] - 蔚来汽车同样选择WA技术路线 [21] - 宇树科技创始人质疑VLA为"相对傻瓜式架构" 引发行业讨论 [18][20] VLA技术原理与优势 - 工作原理:将传感器信息转化为语言文字 再通过语言大模型进行逻辑推理后输出动作 [30][32] - 解决端到端架构可解释性差的问题 工程师可直接修改描述文字进行纠错 [37][50][51] - 增强系统交互能力 支持通过语音指令控制车辆动作 如"向左转"或"找车位停"等 [56][57] - 提升复杂场景处理上限 通过类人思考做出更拟人化决策 [63][64] - 理论上有助实现从L2向L3 L4级自动驾驶突破 [87] VLA技术挑战 - 架构复杂度增加 需投喂大量数据训练才能体现体感差异 [74][75] - 对算力要求极高 需要大算力芯片支持实时分析 [77][80] - 小鹏自研图灵芯片已装车 理想自研M100芯片单颗算力据称可达3颗英伟达Thor-U [82] - 需要更大资金与技术投入 软硬件要求均高于传统端到端架构 [84][87] 行业技术发展现状 - 目前所有企业仍处于L2级辅助驾驶阶段 能力不足是重要制约因素 [42] - 最后5-10分的性能提升最为困难 但却是实现更高级别自动驾驶的关键 [43][44] - VLA技术不仅限于车端应用 在AI机器人等领域也有拓展潜力 [70][71]
理想汽车(2015.HK):2025Q2毛利保持韧性 VLA规模化部署在即
格隆汇· 2025-08-30 19:04
财务表现 - 2025Q2单季营收302.5亿元 同比-4.5% 环比+16.7% [1] - 汽车业务收入288.9亿元 同比-4.7% 环比+17.0% [1] - 归母净利润10.9亿元 同比-0.8% 环比+68.0% [1] - non-GAAP归母净利润14.6亿元 同比-2.7% 环比+43.8% [1] - 汽车业务毛利率19.4% 同比+0.7pct 环比-0.3pct [1][2] - 经营性利润8.3亿元 利润率2.7% 同比+1.3pct 环比+1.7pct [2] - 平均售价由26.6万元降至26.0万元 [2] 销量与产品结构 - 2025Q2交付11.1万辆 同比+2.3% 环比+19.6% [1][2] - L6占比46.8% L7占比23.8% L8占比13.3% L9占比13.0% Mega占比3.1% [2] - 其他业务营收13.6亿元 同比+0.1% 环比+9.0% [2] 成本与费用 - 研发费用28.1亿元 同比-7.2% 环比+11.8% 费用率9.3% [3] - 销售管理费用27.2亿元 同比-3.5% 环比+7.4% 费用率9.0% [3] - 经营活动现金净流出30亿元 自由现金流-38亿元 [3] 基础设施与网络 - 零售中心530家覆盖151城 售后维修中心511家覆盖222城 [3] - 超充站2,902座 充电桩15,945根 覆盖255城 [3] 未来展望 - 2025Q3预计交付9.0-9.5万辆 同比-41.1%至-37.8% [4] - 2025Q3预计收入248-262亿元 同比-42.1%至-38.8% [4] - 纯电SUV i6计划9月发布 起售价25万元 续航720km [4] - VLA系统9月覆盖增程AD Max车型 11月有重大更新 [4] - 预计2027年实现L4自动驾驶 [4] 长期预测 - 预计2025-2027年收入1,272.1/1,780.4/2,009.5亿元 [4] - 预计同期归母净利润50.1/114.1/145.5亿元 [4]
理想汽车 | 2025Q2:毛利保持韧性 VLA规模化部署在即【民生汽车 崔琰团队】
汽车琰究· 2025-08-30 14:56
财务表现 - 2025Q2单季营收302.5亿元,同比下降4.5%,环比上升16.7% [2][3] - 汽车业务收入288.9亿元,同比下降4.7%,环比上升17.0%,环比增长主要因交付量增加 [3] - 归母净利润10.9亿元,同比下降0.8%,环比大幅上升68.0% [2] - non-GAAP归母净利润14.6亿元,同比下降2.7%,环比上升43.8% [2][5] - 汽车业务毛利率19.4%,同比提升0.7个百分点,环比下降0.3个百分点 [2][5] - 汽车业务毛利56.1亿元,同比下降1.3%,环比上升15.1% [5] - 经营性利润8.3亿元,利润率2.7%,同比提升1.3个百分点,环比提升1.7个百分点 [5] - non-GAAP净利润率4.8%,同比提升0.1个百分点,环比提升0.9个百分点 [5] 销量与定价 - 2025Q2总交付量11.1万辆,同比增长2.3%,环比增长19.6% [2][3] - 平均售价(ASP)从2025Q1的26.6万元下降至26.0万元,主要因产品组合变化、利息补贴和销售激励增加 [3] - 销量结构:理想L6占比46.8%,L7占比23.8%,L8占比13.3%,L9占比13.0%,Mega占比3.1% [3] 业务细分 - 其他业务(含配套服务)营收13.6亿元,同比增长0.1%,环比增长9.0%,主要因汽车累计销量增加带动服务需求 [4] 费用与投入 - 研发费用28.1亿元,同比下降7.2%,环比上升11.8%,研发费用率9.3%,同比下降0.3个百分点,环比下降0.4个百分点 [6] - 销售管理费用27.2亿元,同比下降3.5%,环比上升7.4%,费用率9.0%,同比上升0.1个百分点,环比下降0.8个百分点 [6] - 截至2025年6月30日,零售中心覆盖151个城市共530家,售后维修中心覆盖222个城市共511家 [6] - 截至2025年7月20日,超充站达2,902座,充电桩15,945个,覆盖31个省份、255个城市 [7] 现金流 - 2025Q2经营活动所用现金净额30亿元,自由现金流为-38亿元 [8] 未来展望 - 2025Q3预计交付量9.0万至9.5万辆,同比下降41.1%至37.8%,对应收入248亿元至262亿元,同比下降42.1%至38.8% [9] - 纯电SUV理想i6计划9月发布,定位中大型5座,起售价25万元,续航最高720km,搭载VLA大模型,面向年轻消费群体 [9] - VLA系统9月起覆盖所有增程车型AD Max版本,9月底推送完整版,11月有重要更新,预计2027年实现L4自动驾驶 [9] 盈利预测 - 预计2025年收入1,272.1亿元,2026年1,780.4亿元,2027年2,009.5亿元 [10][12] - 预计2025年归母净利润50.5亿元,2026年114.1亿元,2027年145.5亿元 [10][12] - 对应2025年8月29日股价,PE估值分别为36倍、16倍、12倍 [10][12]
何小鹏,上了马斯克的贼船?!
电动车公社· 2025-08-28 16:01
全新小鹏P7市场表现 - 全新小鹏P7上市7分钟内获得1万台大定订单 [2] - 对比参考:小米SU7去年上市时1万台大定用时4分钟,小鹏MONA M03去年上市时1万台大定用时52分钟 [4] 技术路线转型 - 公司从激光雷达支持者转变为纯视觉路线坚定支持者 [13] - 公司认为视觉系统上限远超激光雷达,预计2027年自动驾驶技术路线之争将消失 [13] - 与特斯拉马斯克技术路线趋同,均认为激光雷达会降低安全性 [15][16] 纯视觉方案优势与突破 - 纯视觉方案过去表现不佳主要因算力不足,图像像素点阵和帧率不足导致决策困难 [29][30] - 当前算力较以往提升10倍,预计5-10年后算力将再提升10倍 [31] - 算力提升使纯视觉方案在夜间、大逆光、雨雪天等复杂条件下超越人眼感知能力 [33] 自研芯片技术优势 - 自研图灵芯片单颗有效算力相当于三颗英伟达Orin X芯片 [38] - 20万级小鹏G7 Ultra版搭载3颗图灵芯片,车端有效算力达2250TOPS,远超同级产品(多数仅100TOPS) [38] - 自研芯片算力利用率更高,专为自家产品优化,避免通用芯片的功能冗余 [41] - 自研算力领先行业3-10倍,支持功能代际跨越 [43] VLA辅助驾驶系统进展 - 全场景VLA辅助驾驶系统可实时识别水坑深度、行人位置、公交车盲区等复杂场景 [47] - 预计2024年底辅助驾驶能力将比第一阵营强10倍以上 [49] - 支持L4级自动驾驶车型计划2026年量产,并试点Robotaxi运营 [49] 财务与运营表现 - 最近一年半销量相当于过去9年总和 [56] - 2025年二季度总交付量超10万台,创历史新高,同比增长241.6% [56] - 总营收182.7亿元人民币,创历史新高,同比增长125.3% [56] - 毛利率17.3%,同比增长3.3个百分点,现金流475.7亿元人民币 [56] 行业竞争与战略定位 - 与特斯拉在Robotaxi领域可能面临直接竞争,双方均计划2026年扩大规模 [51][52] - 公司未来不排除通过合作方推进Robotaxi商业化运营 [54] - 公司发展聚焦"科技"和"颜值"两大核心方向 [57] - 行业尚未形成稳定格局,存在挑战与机遇并存局面 [60]
新一轮智驾PK,迈入实战时刻
虎嗅APP· 2025-08-27 13:37
新一轮智驾竞赛集中爆发原因 - 监管加强和舆情事件拖后部分公司既定节奏[10] - 各家公司智驾技术底层依赖AI创新突破 时间起点相近[10] - AI底层技术套用于智驾需大量训练和调整 时间周期相对固定[10] - 公司担忧竞对优先发布技术 选择先发布基础版再优化策略[10] VLA模型技术突破 - VLA模型去掉规控时代多环节划分 实现从传感器到控制端单一完整模型[7] - 模型底层从CNN升级为Transformer 大幅提升对人类大脑模仿学习能力[7] - VLA模型下限已超过端到端模型上限 未来持续优化[6] - 相比VLM模型 VLA增加历史状态输入并输出可执行动作 应用于机器人控制和人机交互等领域[8] 思维链能力提升 - VLA通过语言媒介模仿人类思考模式 将驾驶决策分解为连贯推理步骤[11] - 分步推理提升复杂路况处理可靠性 例如识别校车后减速并检测儿童横穿风险[15] - 决策依据以可理解语言展现 增强系统可解释性和事故追溯能力[15] - 模型通过海量数据学习推理逻辑 获得泛化能力处理未知新场景[15] 实际道路表现 - 在立交桥下辅道人车混行场景 持续自我推理并将车速降至绝对安全范围[16] - 视线被遮挡路口感知对向电瓶车时 决策从控速升级为主动降速预留反应空间[18] - 丁字路口汇入前提前分析识别 降速后再汇入车流避免被迫变道[20] - 复杂十字路口综合天气和行人动态推理风险 以缓慢安全方式通过[22] 行业发展趋势 - VLA模型成本差异主要在芯片 15万元以上车型可适配 10万元级别车型通过优化有望搭载[26] - 智驾芯片将加强对Transformer支持 尤其在FP4和FP6精度算力优化[26] - 自研辅助驾驶系统需经历规则算法、端到端1.0到VLA过程 无法完全跳过发展阶段[26]
新一轮智驾PK,迈入实战时刻
虎嗅· 2025-08-27 10:38
新一轮智驾技术竞赛背景 - 中国头部智驾公司近期集中落地最新智驾能力 包括理想汽车推送VLA司机大模型 Momenta与智己合作R6飞轮大模型 元戎启行发布VLA大模型 小鹏发布全新VLA大模型 华为计划9月推送ADS 4系统 [2][5] - 行业动作集中源于四大驱动力:监管加强推迟部分公司节奏 AI底层创新突破时间相近 技术适配需要固定训练周期 公司担心竞品抢先选择先发布基础版再优化策略 [3][6] VLA模型技术突破 - VLA模型相比传统端到端模型取消感知/定位/预测/规划等独立环节 实现从传感器到控制端的单一完整模型架构 [7] - 模型底层技术从CNN升级为Transformer 显著提升对人类大脑模仿学习能力 [8] - VLA模型具备思维链(CoT)能力 通过语言媒介模仿人类驾驶思考 将决策分解为连贯推理步骤 [9] - 相比VLM模型 VLA在输入输出和应用层面更贴合智驾需求 输入包含图像/文本/历史状态 输出为可执行动作 应用领域涵盖机器人控制和自动驾驶 [9] VLA模型核心优势 - 增强决策逻辑性:面对校车/儿童等复杂路况时能分步推理 显著提升可靠性及安全性 [11] - 提升系统可解释性:以人类可理解语言展现决策依据 助力研发调试与事故追溯 [11] - 强化泛化能力:通过海量数据学习推理逻辑 实现应对未知新场景的能力 [11] - 实际测试显示防御性驾驶能力突出 在立交桥辅道主动降速至安全范围 在视线遮挡路口预判电瓶车风险主动降速 在丁字路口提前分析并缓速汇流 [12][14][15][16] 技术应用体验升级 - 驾驶体验实现综合性飞跃 包括更顺滑控车/更果断反应/全程安全感提升 极端场景仍需人工接管但信任感显著增强 [17] - 支持语音指令交互 可响应"加速/减速"等基础操作 并能直接读取交通标识文字执行优化驾驶 [17] 行业发展趋势 - VLA模型当前尚未完全实现思维链能力 自评仅达6分(满分10分) 需持续收集测试数据并优化后训练 [18][19] - 成本差异主要集中于芯片 15万元以上车型可适配 10万元级别车型经优化也有搭载可能 [20] - 智驾芯片将加强Transformer支持 重点优化FP4/FP6精度算力 [21] - 车企自研辅助驾驶系统需经历规则算法/端到端1.0/VLA的完整技术演进过程 无法完全跳过特定阶段 [21]
7天闪电战,理想用「听劝力」改写爆款逻辑
36氪· 2025-08-11 15:41
行业竞争态势 - 中国汽车市场每年推出近百款新车 座舱及辅助驾驶能力快速迭代 价格战激烈程度达前所未有水平 [3] - 2025年前七个月有30余款全新新能源车型上市 价格带宽横跨5万至100万元 覆盖轿车和SUV全品类 [4] - 新能源渗透率突破50%后消费群体转向实用主义主导 传统用户教育策略失效 动态适配能力成为关键 [6] 理想汽车产品策略 - i8上市一周后迅速调整产品配置:将Max版本作为标准配置定价33.98万元 铂金音响改为标配 后排娱乐屏改为1万元选装项 [3][8] - 配置调整基于上市首周订单数据:98%订单集中在Max/Ultra版本 反映用户对VLA大模型及高阶舒适配置的强烈需求 [6] - 采用"单配置+选装包"极简产品矩阵 降低用户决策难度 精准锚定30-40万元六座SUV价值临界点 [15] 供应链与组织能力 - 配置调整需联动全产业链:7日内完成供应商协商 生产逻辑重新编程 已下线车辆消化处理 [8] - 市场营销/渠道/法务体系需同步刷新信息 体现企业组织能力的极限测试 [8] - 凭借互联网基因的敏捷决策机制和供应链信任资本 实现战略意图无损传导 [8] 市场定位与产品优势 - 30-40万元纯电SUV市场存在战略空白:销冠特斯拉Model Y上半年销量43,917辆(月均7,300辆) 第二名仅20,000辆(月均3,300辆) [10] - i8以六座全舒适空间直击家庭多代出行需求 第三排坐高333毫米 180cm身高乘客腿部空间超一拳 [12] - VLA智驾大模型通过自研世界模型复现99%中国路况 动态生成2,000余种长尾场景 具备优秀复杂场景处理能力 [12] 品牌竞争壁垒 - 2025上半年在30-40万元区间销量已超越BBA同级产品 增程车型成功培育品牌基本盘 [15] - 作为第七款车型延续爆款基因 通过需求转化效率竞赛在细分市场窗口期建立现象级产品地位 [15]
万字释疑理想VLA,总负责人郎咸朋:技术与研发流程改革都是挑战
36氪· 2025-08-04 05:05
产品发布与定位 - 理想i8为首款纯电SUV车型,售价32.18万至36.98万元,主打中大型六座市场[1] - 产品亮点包括三排六座布局与同级别优秀的二排过道/三排腿部空间,但后备箱空间在满员时受限[1] - 全系标配5C超充电池与双腔空气悬架,针对存在里程焦虑且追求舒适性的消费群体[1] VLA技术架构 - VLA采用4B参数模型,基于自研0.4×8 MoE架构,推理帧率达10Hz(较VLM提升3倍)[5][6] - 技术突破包括3D+2D视觉融合、思维链推理能力,可理解并执行动作[2][17] - 通过32B云端大模型蒸馏至3.2B车端模型,采用流匹配技术将Diffusion推理步骤从10步压缩至2步[19] 算力与芯片优化 - 在Thor芯片实现FP8量化精度下1000TOPS算力,计划向FP4演进[26][28] - 通过魔改CUDA底层、重写PTX指令实现Orin芯片部署大模型[15] - 训练算力从规则算法时代不足1EFLOPS增长至端到端时代的10EFLOPS[10] 数据与训练体系 - 累计12亿数据闭环,2024年实车测试缩减至2万公里,仿真测试占比超90%[8][12] - 构建40万+评测场景库,单日峰值仿真里程达30万公里[25] - 采用"老司机数据"标准,通过云端大模型清洗1000万量级训练数据[36][37] 技术路线比较 - VLA相较端到端路线突破数据限制,通过世界模型生成海量训练场景[2][40] - 当前MPA(事故间隔里程)达300万公里,目标提升至人驾水平的10倍(600万公里)[11] - 研发团队规模控制在200人左右,强调算法-数据-算力三角平衡[32][33] 商业化进展 - 辅助驾驶事故率现为人驾的1/6(350-400万公里/次 vs 60万公里/次)[11] - 计划实现驾驶风格个性化定制,通过强化学习模拟车主驾驶习惯[26] - 法律政策被视为L4落地核心制约因素,公司参与相关法规讨论[7]