多传感器融合方案

搜索文档
复制马斯克想法?小鹏汽车放弃激光雷达,转投视觉方案,马斯克回应“笑哭”表情【附自动驾驶行业市场分析】
前瞻网· 2025-09-29 08:37
小鹏汽车技术路线转向 - 小鹏汽车自动驾驶总监表示公司将放弃激光雷达 转而采用纯视觉技术 因激光雷达数据无法被AI系统吸收 而视觉数据能让系统快速发展[2] - 新AI系统基于大量客户驾驶过程中剪辑的10秒或30秒短视频数据构建[2] - 该决策被网友视为复制马斯克的想法 马斯克本人用"笑哭"表情回应[2] 特斯拉纯视觉方案立场 - 马斯克多次公开力挺纯视觉方案 称激光雷达是"多余的阑尾" 认为多传感器数据冲突会降低安全性[4] - 强调道路规则是为"人眼+大脑"设计 只要摄像头配合端到端神经网络就能在成本和可靠性上碾压融合方案[4] - 特斯拉自2021年取消毫米波雷达后 全系车型押注8颗摄像头的"Tesla Vision"系统[4] 感知技术路线对比 - 视觉方案优势在于成本较低且摄像头性能不断提升 但在恶劣天气条件下感知能力会严重下降[5] - 多传感器融合方案结合激光雷达 摄像头和毫米波雷达优势 激光雷达具有测量精度高 响应时间短和抗干扰能力强特点[7] - 融合方案面临传感器数据融合难度大 不同数据可能冲突导致系统决策复杂 同时增加成本和系统复杂性[7] 激光雷达市场渗透情况 - 全球L2及以上智能驾驶渗透率近三年增加15.1% 国内从2022年0.5%增至2024年5.5%[9] - 2024年1-10月中国乘用车激光雷达安装量TOP5品牌:鸿蒙智行31.8万颗 理想汽车18.6万颗 蔚来16.7万颗 极氪12.0万颗 阿维塔9.1万颗[10] - 激光雷达在中国呈"标配化"趋势 2023年车载激光雷达市场规模超30亿元 五年行业复合增速达124.20%[10] 技术发展现状与趋势 - 当前无论是多传感器融合还是视觉方案都处于研发初步阶段 对外依赖程度高且存在各自需要克服的困难[12] - 视觉方案需提升摄像头在恶劣环境下的性能并优化复杂场景识别算法 融合方案需解决传感器数据融合难题[12] - 未来竞争将更加激烈 能够以最便宜价格提供相同功能产品的方案将成为感知技术的最终发展方向[13]
自动驾驶的流派纷争史
36氪· 2025-09-28 02:50
自动驾驶商业化进展 - 截至2025年5月 Waymo在美国4个城市运营1500辆自动驾驶出租车 每周完成超25万次付费出行服务[1] - 百度Apollo全球部署超1000辆无人驾驶汽车 累计提供超1100万次出行服务 安全行驶里程超1.7亿公里[1] 传感器技术路线分歧 - 纯视觉方案采用8个环绕摄像头模拟人类视野 依赖深度学习算法从二维图像重建三维环境 成本极低适合大规模商业化[7] - 多传感器融合方案以激光雷达为主 可生成精确3D点云图 早期造价达7.5万美元 但能应对恶劣天气条件[5][9] - 主流车企包括Waymo、小鹏、蔚来选择多传感器融合 认为安全冗余是不可逾越的红线[9] 传感器内部选择差异 - 激光雷达角分辨率极高 能清晰分辨行人姿态和车辆轮廓 是L4/L5自动驾驶必备传感器[11] - 4D毫米波雷达成本仅数百元 具备强大穿透能力 可在恶劣天气下工作 但点云稀疏无法勾勒物体轮廓[13] - L4 Robotaxi和豪华车采用"激光雷达为主 毫米波雷达为辅"策略 L2+/L3经济车主要依赖"摄像头+毫米波雷达"方案[15] 系统架构发展路径 - 模块化设计将驾驶任务拆分为感知、预测、规划、控制等独立子任务 可解释性强且易于调试[16] - 端到端模型直接将传感器原始数据映射到驾驶控制指令 全过程无信息损失但存在黑箱难题[18] - 行业出现"显式端到端"折中方案 保留可行驶区域等中间输出以平衡性能与可解释性[18] 大模型应用方向 - VLM视觉语言模型追求过程可控 利用图像-文本配对数据预训练 技术相对成熟更易落地[19][23] - VLA视觉语言动作模型主张模型自主学会驾驶规则 需要海量视频-控制信号配对数据 训练成本高昂[21][23] - Waymo、Cruise、华为、小鹏选择VLM路线 特斯拉、吉利和理想探索VLA路线[25] 技术融合趋势 - 纯视觉方案开始引入更多传感器 多传感器融合方案中视觉算法地位提升[9] - 模块化架构开始吸收端到端优势 大模型为所有系统注入认知智能[25] - 激光雷达与视觉正在融合为多模态感知系统[25]
牵手Momenta 上汽通用加码智驾 卢晓:技术分歧在所难免,关键是找到最优解
每日经济新闻· 2025-08-19 11:24
合作背景与基础 - 上汽通用与Momenta于8月18日签署辅助驾驶领域战略合作协议 双方合作始于2024年4月 围绕城区辅助驾驶研发范式和功能普及展开 [2][4] - 合作基于共同的安全理念 技术分歧通过寻找最优解决方案处理 安全是双方合作的底线 [1] - 泛亚汽车技术中心执行副总经理曾瑜将合作比喻为"大脑"和"肌肉"的优势互补 Momenta擅长智能大模型 上汽通用具备整车性能专业积累 [2] 技术方案与架构 - 上汽通用推出全新一代"逍遥"超级融合整车架构 融合车身、底盘、动力总成和电子电气架构技术 从2025年起所有本土新能源车型基于该架构打造 [6][8] - 辅助驾驶需要车身结构、电子架构、智舱、智能底盘和动力系统全车协同 是复杂的系统工程 [6] - 公司采用多传感器融合方案 包括激光雷达 通过冗余设计保障安全 认为特斯拉FSD依赖美国数据训练 在中国市场可能面临适应性挑战 [8][9] 产品落地与数据能力 - 别克高端新能源子品牌"至境"首款轿车至境L7于8月18日首发 搭载Momenta R6飞轮大模型 提供"无断点"城市NOA和"不停车一键泊入"全场景辅助驾驶功能 计划2024年秋季交付 [5] - Momenta拥有量产30多万台车和30亿公里数据 构建丰富仿真测试场景 数据来自真实量产数据回流 泛亚"老司机"数据也导入系统用于测试 [8] - 后续别克品牌将推出更多搭载Momenta系统的车型 [5] 技术理念与竞争 - 不同技术方案本质是软硬件协同下的系统级响应效率竞争 表现为视觉、非视觉或视觉与激光雷达的差异 [11] - 技术路线应当百花齐放 最终目标是为客户创造更安全、舒适、高效的智能体验 [11] - 辅助驾驶调校需要理论分析、仿真验证和实车验证结合 针对不同车型特性进行精密调校 例如SUV或MPV重心高于轿车 需针对性调校避免侧倾 [6]
智能辅助驾驶下半场,“第一性原理”失灵了吗?
36氪· 2025-06-20 02:57
智能辅助驾驶技术路线 - 特斯拉坚持纯视觉方案的理论基础是全球道路交通体系本质围绕视觉感知能力构建 人工智能结合数字神经网络和摄像头是与现有道路系统最匹配的解决方案 [1] - 马斯克批评激光雷达技术 认为道路系统并非为从眼睛发射激光而设计 摄像头与激光雷达同时工作可能导致信息冲突和交通事故 [3] - 纯视觉方案最大优点是成本较低且贴近人眼逻辑 通过对摄像头持续优化可无限接近人类眼睛 [20] 第一性原理 - 第一性原理是系统中最基本的命题或假设 不能被违背或删除 核心思想是回归事物本质 剖析最基本原理构建新认知框架 [3] - 智能辅助驾驶的第一性原理应聚焦本质需求 以标准化能力推动普惠价值 实现从A点到B点的安全 舒适 高效 [4] - 手机行业演进史为汽车智能化提供启示 基带芯片以"稳定传输"为第一性原理 智能辅助驾驶应成为像基带一样可靠的基础设施 [4] 特斯拉技术发展历程 - 2014-2016年外部合作期 采用Mobileye EyeQ3芯片 算力0.25 TOPS 支持1个前视摄像头 1个毫米波雷达和12个超声波雷达 [6] - 2016-2019年自研过渡期 转向英伟达方案 算力10 TOPS 配备8个摄像头 1个毫米波雷达 12个超声波雷达 同时开始自研FSD芯片 [7] - 2019年进入全面自研期 推出HW3.0 配备两颗自研FSD芯片 算力144 TOPS 相比前代增长7倍多 [7][9] 特斯拉技术方案演进 - 引入BEV+Transformer算法栈 让视觉感知网络获得测速 测距能力 将2D画面拼接成360度全景俯视图 [13] - 升级占用网络 将车辆周围空间划分成小方格标记是否被物体占据 实现高分辨率三维感知与重建 [14] - 推出端到端方案 完全采用一张神经网络链接感知 规控和执行 2023年测试中运行速度比原方案更快 删除30万行人工代码 [16][17] 技术方案对比 - 纯视觉方案在信息丰富度 三维深度 测距精度 相对场景可靠性等方面弱于多传感器融合方案 但成本更低 [19] - 激光雷达在探测距离 精度和实时性方面有明显优势 但易受天气影响 可能发生多次反射导致信号失真 [20][21] - 多传感器融合方案需承担更高硬件成本 开发能融合多传感器数据的算法 并采用高算力芯片处理数据 [23]
纯视觉向左融合感知向右,智能辅助驾驶技术博弈升级
36氪· 2025-05-22 03:35
特斯拉纯视觉方案 - 公司坚持视觉处理方案,目标是让人人买得起安全智能的产品[1] - 即将推出基于纯AI技术的通用型全自动驾驶(FSD)解决方案,延续2016年以来的视觉优先战略,完全抛弃激光雷达[1] - 方案仅依靠摄像头和自研芯片实现L4-L5级自动驾驶,连毫米波雷达也已弃用[4] - 视觉方案搭配端到端神经网络架构,通过数十亿真实世界数据样本训练,实现多场景安全驾驶[4] - 公司认为先进技术不需要昂贵繁杂的传感器,纯视觉最贴近人类驾驶习惯,是自动驾驶的"第一性原理"[4] 激光雷达市场发展 - 全球乘用车激光雷达市场2024年同比增长68%,规模达6.92亿美元[1] - 中国激光雷达配置车型达94款,相比上一年度翻倍[1] - 激光雷达成本8年内降低99.5%,从数千美元降至200美元左右[1] - 行业认为激光雷达正从"可选功能件"进化为"必选安全件"[1] - 2024年高阶智能辅助驾驶进入20万元以内市场,激光雷达上车趋势明显[19] 技术路线对比 纯视觉方案 - 依靠摄像头捕捉RGB图像数据,通过深度学习算法提取语义特征[6] - 最大优势是硬件成本低、系统集成简单,但依赖算法处理能力[6] - 在恶劣天气和复杂光照条件下可靠性面临挑战[6] - 需要处理大量图像数据,对系统算力和能耗要求高[6] 多传感器融合方案 - 结合激光雷达、摄像头、毫米波雷达等多种传感器[8] - 激光雷达测距精度达厘米级,不受光照影响[11][12] - 摄像头提供丰富语义信息但受环境影响大[11][12] - 毫米波雷达在恶劣天气表现稳定但分辨率低[11][12] - 多传感器融合可弥补单一传感器缺陷,提升系统鲁棒性[17] 市场应用差异 - 特斯拉FSD在北美渗透率超30%,但可能低估中国路况复杂性[7] - 中国车企针对"鬼探头""加塞"等本土场景开发针对性解决方案[7] - 理想汽车CEO表示激光雷达在中国路况下可实现130公里/小时AEB功能,比纯视觉方案探测距离更远[16] - 华为、理想等企业认为L3/L4级自动驾驶必须配备激光雷达[13] 行业发展趋势 - 技术路线本质是"算法驱动"与"硬件驱动"的理念之争[16] - 特斯拉通过海量数据训练全能算法,国内车企通过硬件堆砌安全冗余[16] - 行业正从"单车智能"向"系统智能"演进,结合V2X实现协同控制[19] - 智能辅助驾驶进入规模化普及阶段,安全是行业不可逾越的底线[20]
从“能动”到“灵动”,机器人智能化步入新篇章
2025-05-12 01:48
纪要涉及的行业或公司 - **行业**:机器人行业,尤其是人形机器人领域 - **公司**:志远公司、优必选、英伟达、特斯拉、DRECOM、全志、瑞芯微、黑芝麻智能 纪要提到的核心观点和论据 - **技术发展现状**:过去两到三年人形机器人领域技术进步显著,国内优必选等公司在运动能力方面表现突出,能在预设环境完成固定动作达产业推广阶段,但智能化水平未达灵动阶段,如无法完成拿起水杯喝水等细节复杂动作,需与AI和自动化系统结合[2] - **视觉传感方案差异**:海外特斯拉采用纯视觉方案降低硬件成本但对大模型算力要求高,国内因算力限制和传感器供应链优势,预计未来以激光雷达加3D视觉传感器等多传感器融合方案为主[3][10] - **应用前景和商业化进展**:潜在需求覆盖工业制造、物流配送等场景,可弥补劳动力短缺和替代危险工作,目前商业化处于早期,工业场景应用集中在搬运等标准化流程,预计在流程标准化且人力成本高的场景率先落地[1][4] - **商业化面临困难**:硬件方面执行器、传感器精度等需提升,续航短成本高;软件方面人机交互效率低,多模态感知准确性偏低等,导致难以准确理解任务指令和调整行动规划,提高智能水平是关键[1][5] - **解决训练数据集匮乏方案**:增加真实数据采集,如志远公司搭建模拟生活空间,北京、上海等地建创新中心;采用物理仿真方法,如英伟达提供的方法,旨在提高训练数据质量,加速商业应用拓展[1][6][7] - **仿真技术提高数据获取效率**:调整场景参数或变化场景,可基于少量真实数据衍生大量训练数据,提高效率降低成本,但仿真结果与真实世界有偏差,需真实数据校正,未来主流是结合真实与仿真数据采集[8] - **机器人基座大模型发展趋势**:呈现多系统架构趋势,如NVIDIA的Grace Hopper等,未来需解决多模态和泛化能力问题,以适应复杂环境和提高运动技能学习效率[1][9] - **力学和触觉传感发展方向**:朝着更精准的感知及执行方向发展,六维力传感器及电子皮肤是未来方向,实现实时控制需高效机械通信协议及强大算力硬件支撑[11] - **EtherCAT协议优势**:采用分布式架构设计,将通信延迟控制在微秒级别,优于CAN总线协议和其他实时工业以太网协议,有望成机器人主流通信协议[3][12] - **端侧芯片应用现状**:机器人大脑大模型芯片主要有英伟达Orin和特斯拉自研芯片,小脑任务对算力需求低,国产芯片已应用于部分机器人,端侧算力需求预计持续增长,国产芯片性能提升带来机遇[13] 其他重要但是可能被忽略的内容 - DRECOM即将发布NPU与DMC堆叠封装新产品,适合端侧运行大模型,专门定制化硬件预计2025年或2026年进入市场,一级市场股权投资向自动化方向转移[14]