WA
搜索文档
专访地平线副总裁吕鹏:做不好端到端就做不好VLA
21世纪经济报道· 2025-12-23 00:45
市场格局与公司进展 - 今年前三个季度,国内20万元以上乘用车市场份额占比30%,13万元以下市场份额则高达50%,但后者多数车型尚未配备城区辅助驾驶功能,这一广阔的蓝海市场正吸引着地平线、Momenta等智驾厂商加速布局 [1][13] - 地平线于今年4月正式推出基于征程6系列芯片的城区辅助驾驶解决方案HSD,并于11月随星途ET5和深蓝L06上市实现量产,两款车型上市短短两周后,HSD激活量便突破12000辆 [1][13] - 公司通过生态拓展加速市场渗透,在12月初的技术生态大会上公布两大举措:拓展生态合作模式,新增算法服务模式“HSD Together”,并与日本电装、大众合资公司CARIZON、HCT达成合作;引入更多生态合作伙伴,如元戎启行、卓驭等 [1][13] - 缺乏芯片研发能力的算法公司、软硬研发实力薄弱的车企正纷纷向地平线聚拢,公司目标是让城区辅助驾驶功能下沉至10万元国民车型,并计划在未来3—5年内达成千万级量产规模 [2][14] 技术路线与研发投入 - 地平线敢于制定千万级量产目标的底气源于其在智驾端到端方案上的长期坚守与深耕,公司自2024年底便集中力量主攻端到端技术,90%的研发人力均投入到该方案的研发与量产落地工作中 [2][14] - 公司认为,无论是世界模型(WA)还是视觉语言动作模型(VLA),都需要建立在非常完整的端到端底座之上,没有扎实的端到端基座,高阶智驾就是空中楼阁 [2][9][10][14][21][22] - 地平线是目前行业内少数坚定选择端到端路线的厂商,其最早的端到端架构uni AD曾获得CVPR最佳论文,核心底气来自过去丰富的技术积累 [2][14][15] 技术方案详解 - 地平线HSD的端到端版本最核心的技术亮点是“光子进,轨迹出”,公司是除特斯拉之外,少数拥有真正意义上最完整的一段式端到端系统的企业 [4][16] - 所谓两段式端到端,并非一个模型,而是感知模型加规控模型,信息传递存在丢失;而一段式端到端可实现高维特征的无损传递,信息量更高,驾驶体验更接近人类直觉 [6][17] - 两段式端到端存在的原因是一段式方案若不够完善,输出轨迹会有缺陷导致无法控车,开发者会退而求其次增加后处理规则进行修正,但这些规则会限制模型上限并带来驾驶动作的割裂感 [7][18] - 分辨一段式与两段式端到端,对于从业者主要看模型输出轨迹的连贯性和拟人性,特别是在交互场景下动作是行云流水还是按步骤进行,消费者最直观的体验是是否愿意在城市中安心使用该系统 [8][19] 竞争观点与未来展望 - 对于智驾技术路线之争,地平线认为WA或VLA都是基于端到端,语言(language)等模态应作为辅助项,而非开发核心,模型构建应模拟人类开车状态,即95%以上时间依赖直觉模型,仅在极度复杂场景下加入理解与推理 [9][21] - 未来更智能的端到端方案中,仿真闭环是关键核心技术,因为稀疏场景需要通过仿真生成数据验证,随着端到端成熟,遇到问题的场景会越来越稀疏 [10][22] - 公司认为未来最理想的智驾方案是在端到端直觉模型解决95%甚至99%场景的基础上,为剩余需要认知推理的场景叠加思维链理解能力,但一切前提是端到端直觉模型必须足够好 [10][22] - 作为智驾供应商,接下来的竞争核心应聚焦产品体验、安全性和市场认可度,而非追逐新名词和新概念,技术上公司会做好预研和储备 [11][22] - 地平线强调,即使下一代智驾方案包含VLA技术,也不会抛弃当前的端到端技术,因为端到端是VLA得以实现的基础 [12][24]
地平线吕鹏:端到端是基石,做不好端到端就做不好VLA
21世纪经济报道· 2025-12-22 13:23
市场格局与公司进展 - 今年前三个季度,国内20万元以上乘用车市场份额占比30%,13万元以下市场份额则高达50%,但后者多数车型尚未配备城区辅助驾驶功能,市场空间广阔[1] - 地平线于2024年4月推出基于征程6系列芯片的城区辅助驾驶解决方案HSD,并于11月随星途ET5上市实现量产,同期搭载的深蓝L06也发售,两款车型上市两周后HSD激活量突破12000辆[1] - 公司通过生态拓展加速市场渗透,在12月初的技术生态大会上公布两大举措:新增算法服务模式"HSD Together",并与日本电装、大众的合资公司CARIZON、HCT达成合作;引入元戎启行、卓驭等更多生态合作伙伴[2] - 公司目标是将城区辅助驾驶功能下沉至10万元国民车型,并计划在未来3-5年内达成千万级量产规模[2] 技术路线与研发投入 - 地平线坚信端到端技术是基石,自2024年底便集中90%的研发人力投入到端到端方案的研发与量产落地工作中[2] - 公司认为,无论是世界模型(WA)还是视觉语言动作模型(VLA),都需建立在完整的端到端底座之上,若端到端做得不够坚固,则难以引入新模态解决问题[3] - 端到端被类比为人的直觉模型,若直觉模型不完善,仅靠思考推理难以解决复杂场景,甚至可能带来新问题[3] - 公司技术逻辑的核心在于软硬结合,通过更好的硬件支撑大算力,并借助软硬协同优化释放更多性能,最终在消费者体验端带来收益[4] 端到端技术详解 - 地平线是除特斯拉之外,少数拥有真正意义上最完整的一段式端到端系统的企业[4] - 一段式端到端可简单描述为“光子进,轨迹出”,其模型内部进行高维特征的无损传递,信息量更高[4][5] - 两段式端到端并非一个模型,而是感知模型加规控模型的组合,信息传递存在丢失,因为规控模型是依靠感知白名单的检测结果进行训练的[5] - 一段式端到端若做得不完善,输出轨迹会有缺陷导致无法控车,行业退而求其次增加后处理规则进行修正,但这些规则会限制模型上限,导致横纵向操作有割裂感[5] - 对于从业者,分辨一段式与两段式主要看模型输出轨迹的连贯性和拟人性,特别是在交互场景下动作是行云流水还是按步骤执行[6] - 在一段式端到端中,无法精确设定规定车速,模型只能接收期望车速并朝其逼近,但不一定完全达到[6] 行业竞争与未来展望 - 行业内存在不同技术路线,如理想、元戎启行选择VLA,华为和小鹏选择WA或VA模型,但地平线认为它们都基于端到端[7] - 公司认为模型不应以语言为核心进行开发,而应将其作为辅助项,结合端到端基座,这符合人类开车时95%以上时间依赖直觉、仅在极复杂场景加入思考推理的状态[7] - 随着端到端技术成熟,遇到问题的场景会越来越稀疏,仿真闭环对于生成稀疏场景的模拟和验证变得关键[8] - 未来理想的智驾方案是在直觉模型(解决95%甚至99%场景)足够强的基础上,为剩余需要认知推理的场景增加思维链理解能力[9] - 公司认为竞争核心应回归产品体验、安全性及市场认可度,技术上会做好预研和储备[9] - 公司明确表示,即使下一代智驾方案包含VLA技术,也不会抛弃当前的端到端技术,因为后者是前者的基础[10]
华为坚定不走VLA路线,WA才是自动驾驶终极方案?
自动驾驶之心· 2025-08-29 16:03
华为汽车业务成绩与规模 - 截至7月搭载华为乾崑智驾车辆达100万辆 激光雷达发货量超100万台 辅助驾驶累计里程40亿公里 [3] - 截至8月底共有28款合作车型上市 涵盖五个界及阿维塔 深蓝 岚图 猛士 传褀 方程豹 奥迪等品牌 [3] - 车BU从2014年开始投资 历时超十年投入大量研发资源后实现当期盈利 [4] 技术路线战略 - 坚持WA(世界行为模型)技术路线 认为VLA(感知语言行为模型)非自动驾驶终极方案 [4][13] - WA通过vision等直接信息输入控车 无需转换为语言token 可能整合视觉 声音 触觉等多模态数据 [5][14] - 基于WA架构推出WEWA模型(云端世界引擎+世界行为模型) 将于ADS4.0部署 [6] - 辅助驾驶依赖数据驱动 算力与算法 未来行业需公共智能化平台 [15] 商业化与收费模式 - 辅助驾驶收费合理 因需持续迭代维护OTA投入成本 [8][17] - 免费辅助驾驶实为支付方式转移 或限时免费 或成本包含在车价中 或功能不完善 [7][17] - 采用全生命周期管理理念 用户初期购买成本高但长期体验更优 折算后成本不高 [8][18] 产品开发与用户体验 - 匹配新车型最快需6-9个月 [17] - 坚持全栈模式 软硬件充分耦合 保障鸿蒙座舱与乾崑智驾体验及维护升级 [10] - 鸿蒙座舱基于MoLA架构横向打通垂域 纵向打通应用生态与硬件设备 [10] 技术配置与安全理念 - 增加激光雷达等传感器配置为提升安全性 追求零伤亡事故 [19][22] - 例如尊界S800增加侧向与后向固态激光雷达 使系统精度达厘米级 避免泊车事故 [19][20] - 配置增加由用户场景驱动 如识别坑洼农田等复杂环境 [21][22] 未来发展规划 - 2026年辅助驾驶目标具备高速L3能力及城区L4试点能力 [11] - 2027年目标无人干线物流试点及城区L4规模化商用 [11] - 2028年目标无人干线物流规模化商用 [11] - 智能座舱方向发展为"数字保姆"与AI Agent [11]
华为靳玉志:我们不走VLA路线,WA才是自动驾驶终极方案
36氪· 2025-08-28 03:19
业务数据与市场表现 - 截至7月搭载乾崑智驾车辆达100万辆 激光雷达发货量超100万台 辅助驾驶累计里程达40亿公里[1] - 截至8月底共有28款合作车型上市 涵盖五个界及阿维塔、深蓝、岚图、猛士、传祺、方程豹、奥迪等品牌[1] - 车BU从2014年开始投资 历时超十年投入大量研发资源后实现当期盈利[1] 技术路线与产品战略 - 公司认为WA(世界行为模型)是自动驾驶终极方案 而非行业头部企业押注的VLA(感知语言行为模型)[1][10] - WA通过vision等信息直接控车 无需转换为语言token 输入源可包括视觉、声音或触觉[3][11] - 基于WA架构推出WEWA模型(云端世界引擎+世界行为模型) 将于ADS 4.0部署[4] - 坚持全栈模式 软硬件充分耦合 应用于乾崑智驾与鸿蒙座舱 反对解耦导致的体验下降与维护困难[7] - 鸿蒙座舱基于MoLA架构横向打通垂域 纵向打通应用生态、硬件和设备[6][7] 商业化与收费模式 - 辅助驾驶收费具备合理性 因需持续投入迭代、维护和OTA升级成本[5][15] - 指出免费辅助驾驶实质为支付方式转移 可能通过车价内含、限时免费或体验折扣实现[4][15] - 采用全生命周期管理 用户初期投入较高但长期体验更优 硬件可持续升级[16] 安全与技术配置 - 增加激光雷达等传感器主要为提升安全性 追求零伤亡事故[17] - 例如尊界S800增加侧向与后向固态激光雷达 使泊车系统精度达厘米级[17][18] - 配置增加由用户场景驱动 如识别坑洼、农田等复杂环境避免事故[18] 未来发展规划 - 2026年实现高速L3与城区L4试点 2027年开展无人物流试点与城区L4规模化商用 2028年目标无人物流规模化商用[9] - 智能座舱方向为打造"数字保姆"与AI Agent[9] - 认为最终实现L3/L4的企业数量有限 因依赖数据驱动与公共智能化平台[12]
华为高管:世界上根本没有免费的东西
半导体芯闻· 2025-08-27 10:40
华为车BU合作模式 - 华为车BU与车企合作模式包括部件、单智(智舱或智驾)、双智(智舱和智驾兼具)、全栈等多种模式,合作深度依次递增[2] - 全栈合作模式下,华为从IPD到IPMS全过程"陪跑"车企,覆盖产品定义、设计、制造到营销全环节[2] - 奥迪是华为智驾合作的第一个外资品牌,但未来还会有第二家、第三家外资品牌加入合作[6] 乾崑智驾技术与发展规划 - 乾崑智驾品牌命名源于华为logo不能贴在车上,需独立品牌标识[5] - 匹配一款车型的智驾系统最快需6~9个月[6] - 搭载乾崑智驾的车辆已达100万辆,且ADS 4即将大规模上车[2] - 公司未设定明确商业化目标,坚持长期投入,不追求当期盈利[7] 智驾技术路线与行业观点 - 华为不认同VLA(视觉-语言-动作)技术路线,认为WA(世界-动作)模型才是终极方案,通过视觉、声音、触觉等信息直接控制车辆[3][9] - 自动驾驶行业未来将进一步汇聚,因技术依赖数据驱动,需大量数据、算力和算法支撑,公共智能化平台将更重要[10] - 智驾本质是提供"数字司机",追求零事故零伤亡,差异化较低,溢价取决于用户感知价值[11] 辅助驾驶商业化观点 - 辅助驾驶功能不可能免费,研发投入需通过车价或未来收费覆盖,免费策略实为转移支付方式[3][12] - 功能包定价高可保障长期迭代和维护,提升用户体验周期;低价购买可能导致短期失效,实际成本更高[12]
华为高管:世界上根本没有免费的东西
第一财经资讯· 2025-08-27 08:51
华为车BU合作模式 - 华为车BU与车企合作模式包括部件、单智(智舱或智能辅助驾驶其一)、双智(智舱和智能辅助驾驶兼具)、全栈等多种模式,合作深度依次递增 [2] - 华为车BU从IPD到IPMS全过程"陪跑"车企,覆盖产品定义、设计、制造到最终营销的全流程 [2][9] - 华为车BU与车企深度全栈合作的原因在于部分车企(特别是央国企)制造能力强但前后端需加强,华为可提供IPD和终端经验赋能 [9] 乾崑智驾业务发展 - 乾崑智驾品牌命名因华为logo不能贴车,故独立命名便于车辆标识 [5] - 乾崑智驾匹配一款车型最快需6~9个月 [6] - 搭载乾崑智驾车辆已达100万辆,华为ADS 4即将大规模上车 [2] - 奥迪是华为智驾合作的首个外资品牌,未来将有更多外资品牌合作 [7] - 乾崑智驾无明确商业化目标,不追求当期盈利,坚持长期主义投入 [8] 智能驾驶技术路径 - 华为乾崑不采用VLA(视觉语言动作模型)技术路径,认为其通过语言转换控制车辆非终极方案 [3][10] - 华为更看重WA(World和Action)路径,通过视觉、声音、触觉等信息直接控制车辆,虽难度大但被视为终极方案 [3][10] - 自动驾驶行业玩家数量将持续减少,因技术路径依赖数据驱动(数据量、算力、算法),需公共智能化平台支撑 [11] 辅助驾驶商业化与竞争 - 辅助驾驶功能本质是提供"数字司机",追求零事故零伤亡,差异化程度低 [12] - 功能溢价取决于用户价值认知,而非技术差异化 [12] - 辅助驾驶功能不可能免费,免费策略实为成本转嫁(如含在车价或未来收费) [13] - 功能包定价高可保障长期迭代和维护,提升用户体验周期;低价可能导致短期失效,实际成本更高 [13]