Workflow
端到端自动驾驶技术
icon
搜索文档
中游智驾厂商正在快速抢占端到端人才......
自动驾驶之心· 2025-12-15 00:04
行业技术发展趋势 - 智能驾驶领域的技术焦虑正在产业链中游厂商间快速传播[1] - 业内认为,端到端等前沿技术的大规模量产起点将在明年[2] - 当前智驾前沿技术发展放缓,量产方案趋同,L2级智能驾驶正走下沉路线[2] - 随着明年L3法规的进一步推进,中游厂商面临迫切的技术升级压力[2] - 近期许多公司的算法负责人正积极寻求了解端到端、世界模型、VLA、3DGS等前沿技术[2] 市场与量产现状 - 中国二十万以上的乘用车年销量约为700万辆[2] - 头部新势力品牌在此价格区间的销量占比不及三分之一[2] - 已实现端到端技术量产的车型占比更低[2] - 端到端技术的成熟被视为开启更大规模量产的关键[2] - 地平线公司宣布将进军10万级市场,表明高阶智驾正迅速向更多国民车型下沉[2] 技术实施与人才需求 - 端到端自动驾驶不仅仅是一个算法,其落地需要完善的云端与车端基础设施、数据闭环、工程部署、闭环测试、模型优化及平台开发等全套能力[2] - 可以预见,市场对中阶智能驾驶相关岗位的需求将更加旺盛[2] - 端到端和VLA(视觉语言动作模型)领域的招聘需求预计将显著增长[3] 行业培训动态 - 为应对技术升级需求,市场出现了针对端到端和VLA技术的实战培训课程[3] - 相关课程由工业界与学术界的专家联合开展,聚焦量产落地[3] - 课程内容涵盖导航信息应用、强化学习优化、Diffusion和自回归模型量产经验、时空联合规划等核心模块[3] - 另有课程专门梳理BEV感知、大语言模型、扩散模型和强化学习在端到端领域的应用,并设计相关实战项目[6] - 针对VLA领域,有课程从VLM(视觉语言模型)解释器到模块化、一体化及推理增强VLA进行全面梳理,并包含从零搭建模型的大作业[11] - 课程讲师及团队背景雄厚,多来自国内顶级主机厂、Tier1供应商及顶尖高校,拥有丰富的算法研发、预研及量产交付经验[5][8][13][14]
上交最新!端到端&VLA综述:广义范式下的统一视角
自动驾驶之心· 2025-12-11 00:05
文章核心观点 - 上海交通大学AutoLab团队与滴滴联合发布综述《广义端到端自动驾驶的综述:统一视角》,旨在为当前看似割裂的自动驾驶技术路线提供一个统一的分析框架 [3] - 文章提出“广义端到端(GE2E)”概念,将传统端到端、以VLM为中心的端到端和混合端到端三大范式统一起来,认为它们都是解决“从原始传感器输入到最终驾驶决策”这一共同问题的不同表现形式 [4][14] - 行业技术正从传统的模块化架构向数据驱动的端到端范式演进,核心目标是实现“传感器信息输入,动作输出” [2][5] 技术范式统一与定义 - **广义端到端(GE2E)定义**:任何一种通过整体模型将原始传感器输入处理为规划轨迹或控制动作的模式,无论架构中是否包含视觉语言基础大模型(VLM) [4][14] - **三大统一范式**:基于GE2E定义,将现有技术路线归纳为传统端到端、以VLM为中心的端到端和混合端到端 [4][5] - **核心差异**:三种范式在场景表征方式、推理深度以及计算效率的权衡上侧重点不同,但并非割裂的技术路线 [14] 传统端到端范式 - **核心特点**:基于3D场景表征(如BEV或Occupancy),利用对场景的结构化理解进行精确轨迹规划,系统集成度高、执行效率快,是目前车企落地最广泛的实战派 [9][17] - **主要分支**: - **纯规划端到端**:直接从图像/LiDAR映射到规划控制信号,近期研究重点包括多模态融合、生成式建模(如扩散模型)和高效性优化(如轻量化网络、Mamba架构) [18] - **多任务端到端**:引入感知和预测等中间任务,提供更丰富的监督信号,以强化对场景动态的理解,促使更安全鲁棒的规划 [19] - **优势与局限**:优势在于减少模块间信息丢失和误差累积,在结构化场景下稳定性强;局限在于依赖预定义的几何先验且缺乏通用世界知识,面对未见过的长尾场景时泛化能力受限 [9][10] 以VLM为中心的端到端范式 - **核心特点**:利用在大规模互联网数据上预训练的视觉-语言模型作为核心,将驾驶任务转化为多模态理解与推理问题 [11] - **优势**:得益于模型内部丰富的世界知识和强大的推理能力,在开放世界场景中展现出卓越的泛化性与逻辑可解释性,是解决自动驾驶长尾场景的一条可能路径 [11] - **挑战**:相比于传统端到端模型,在生成轨迹的物理精度上存在局限;巨量参数导致高额推理延迟,难以部署到高实时要求的真实驾驶场景 [11] - **研究重点**:包括视觉-语言对齐与时空理解、推理能力(如思维链、RAG)、规划与动作策略落地、以及学习策略与效率优化(如知识蒸馏、强化学习) [30][33][34][35][36][37] 混合端到端范式 - **设计理念**:结合传统端到端的“快直觉”(执行效率高、轨迹精度高)与VLM的“慢推理”(认知能力强),实现优势互补,是当前平衡性能与效率的有效路径 [12][13][38] - **实现方式**: - **在线分层协同**:在推理阶段,VLM作为高层推理引擎指导传统E2E模型,可在感知级或规划级进行融合 [38][39][40] - **离线知识迁移**:在训练阶段利用VLM作为教师模型,通过蒸馏技术将知识注入轻量级E2E学生模型,实现零推理成本增量 [42][43][44] 数据集演进趋势 - **语义化革命**:新一代数据集包含大量自然语言描述和问答对,旨在教会模型理解复杂的交通语境、因果逻辑及人类驾驶意图 [46] - **思维链引入**:数据集转向包含思维链的详细标注,要求不仅给出驾驶动作,还要给出完整的逻辑推导过程 [47] - **生态爆发**:基于nuScenes等经典数据集进行二次开发的图文对数据成为主流,社区正爆发式构建各类带有推理标注的Benchmark [48] - **数据规模示例**:DriveLM-CARLA数据集包含183K帧图像和3.7M个问答对;LMDrive数据集包含3M帧图像和528K个问答对 [50] 不同范式的性能表现 - **开环性能**:在nuScenes、NAVSIM等开环测试中,混合端到端范式表现最佳,证明了VLM带来的世界知识对处理长尾场景、提升规划上限的关键作用;传统端到端算法在数值轨迹预测精确度上依然占据统治地位,在nuScenes前十名中占绝大多数席位;顶尖算法在NAVSIM上的评分甚至超过了人类驾驶员 [54] - **闭环性能**:在Bench2Drive、CARLA Town05 Long等更接近真实驾驶的闭环测试中,传统端到端范式占据绝对主导地位;在Bench2Drive中,最高的路线完成率仍未突破70%,表明长程多样化驾驶任务仍是系统瓶颈 [55] - **VLA范式短板**:在闭环测试中表现稍逊,主要原因是缺乏对细粒度轨迹控制的精确理解能力,难以把握其生成轨迹对环境产生的连续影响 [56] 行业面临的核心挑战 - **长尾数据难题**:现实驾驶场景呈极端长尾分布,决定系统安全的1%稀缺Corner Case(如极端天气、异形车辆)数据获取与消化效率低下;AI模拟数据存在“虚实鸿沟”,VLM微调时易出现“灾难性遗忘” [61][62] - **可解释性信任危机**:传统E2E模型是“黑盒”,缺乏中间可解释性;引入VLM后可能出现思维链推理与规划动作“言行不一”的问题 [63] - **安全与效率平衡**:为兜底安全而外挂基于规则的后处理模块,破坏了端到端的纯粹性,可能导致车辆行为过度保守 [64][65] - **实时性效率焦虑**:VLM参数量庞大,自回归生成机制导致巨大推理延迟;现有优化手段(如蒸馏、剪枝)往往以牺牲模型鲁棒性为代价 [66][67][68] 未来技术发展方向 - **强化学习进阶**:模仿学习预训练结合强化学习后训练将成为主流,使AI能在虚拟环境中通过试错探索,学会在陌生场景中做出最优决策 [70] - **基础模型应用**:基于海量通用数据预训练的VLM基础模型,将为车辆注入世界知识和常识推理能力,成为处理长尾场景的终极武器 [71][72] - **智能体分层架构**:构建类人的分层系统,LLM/VLM作为“大脑”负责慢思考与复杂推理,专用小模型作为“身体”负责快直觉与毫秒级控制执行 [73][74] - **世界模型发展**:让AI具备基于当前状态“预演”未来环境演变的能力,可用于零成本虚拟试错和利用无标签视频进行自监督学习 [75] - **跨模态深度融合**:下一代模型将深度融合LiDAR/深度信息与RGB视觉,兼具语义理解力和3D几何感知精度 [76] - **自动化数据引擎**:构建问题驱动的自动化数据闭环,自动挖掘模型失败的Corner Case、生成场景并训练迭代,从“堆量”转向“提质” [77]
中游智驾厂商,正在快速抢占端到端人才......
自动驾驶之心· 2025-12-09 00:03
行业技术发展趋势 - 智能驾驶领域的技术焦虑正在产业链中游厂商间快速传播[1] - 业内认为端到端等前沿技术的大规模量产起点将在明年[2] - 当前智能驾驶前沿技术发展放缓,行业量产方案趋于同质化,L2级智能驾驶正走下沉路线[2] - 随着明年L3级法规的进一步推进,中游厂商面临迫切的技术升级压力[2] - 近期许多公司的算法负责人正积极寻求了解端到端、世界模型、VLA、3DGS等前沿技术[2] 市场现状与规模 - 二十万元以上的乘用车年销量约为700万辆[2] - 头部新势力品牌在该价格区间的销量占比不足三分之一[2] - 搭载端到端量产方案的车型占比则更低[2] - 地平线公司宣布将进军10万元级市场,表明高阶智能驾驶正迅速向更多国民车型下沉[2] 技术落地与产业影响 - 端到端技术不仅仅是一个算法,其成熟落地需要完善的云端与车端基础设施、数据闭环、工程部署、闭环测试、模型优化及平台开发等全套体系支持[2] - 端到端技术的成熟被视为更大规模量产的开端[2] - 可以预见,市场对中阶智能驾驶相关岗位的需求将更加旺盛[2] - 近几个月,行业对端到端和VLA技术的学习与入门需求显著增加[3] 行业培训与人才需求 - 为应对技术升级需求,出现了针对端到端和VLA技术的实战培训课程[3] - 相关课程由工业界与学术界的专家联合开展,聚焦量产落地[3] - 课程内容涵盖导航信息应用、强化学习优化、Diffusion和自回归模型量产经验、时空联合规划等关键模块[3] - 另有课程专注于VLA领域,内容从视觉语言模型作为解释器,覆盖到模块化、一体化及主流的推理增强型VLA[11] - 课程要求参与者具备一定的自动驾驶基础、了解Transformer大模型、强化学习、BEV感知等概念,并拥有Python和PyTorch编程能力[10]
端到端时代下的自动驾驶感知
自动驾驶之心· 2025-12-05 00:03
自动驾驶技术范式转变:从模块化到端到端 - 行业技术热点已从BEV感知迅速转向端到端自动驾驶方案 [4] - 端到端并非新技术,早期因效果不佳而让位于模块化架构,但随Transformer与BEV发展正强势回归 [9] - 主流方案正将规划模块神经网络化,形成一段式或两段式端到端架构 [9] 端到端架构下的感知范式革命 - 传统感知-规划框架中,感知需提供全量、精确的场景信息供规划使用,因模块化设计使其无法获知规划具体需求 [11] - 端到端最大意义在于实现“规划导向”的感知,即从全量感知转向可学习的按需感知 [14] - 当前多数端到端方案仍沿用传统思路,将人为定义的感知任务作为辅助监督,这被视为感知模块的“手工特征算子”,可能限制模型上限 [13][14] - 感知模块需自我革新,摒弃对人为定义感知任务的依赖,转向可学习的隐式场景理解 [14] 导航引导的稀疏场景表征 - 提出“导航引导感知”概念,模仿人类驾驶员根据导航意图关注场景不同部分,而非进行全量感知 [17] - 基于BEV特征设计场景令牌学习器模块,引入导航信息并预测BEV注意力,将场景压缩为16个场景查询 [18][19] - 规划解码器仅与这16个查询交互即可输出轨迹,实现了对感知信息的极致压缩与高效利用 [19] - 该方案使模型在训练效率和推理速度上成倍提升,并大幅超越现有方案性能 [19] 世界模型作为隐式监督新方向 - 为减少对人为定义感知任务的依赖,引入基于BEV特征的自监督世界模型,通过预测未来帧特征增强场景理解 [20] - 设计在稀疏查询上做轨迹规划,在稠密BEV上做世界模型的方案,兼顾推理效率与训练一致性 [20] - 随着世界模型研究成熟,其有望完全替代人为感知任务,成为隐式场景表征最可靠的监督方式 [21] SSR方案性能与影响 - SSR框架仅用16个自监督可学习的查询作为场景稀疏表征,替代了传统方案中成百上千个人为监督的查询 [22] - 在nuScenes数据集开环测试中,SSR的3秒平均L2误差为0.75米,平均碰撞率为0.15%,推理速度达19.6 FPS,多项指标超越对比方案 [24] - 在Carla仿真闭环测试中,SSR的驾驶得分达78.9,路线完成率达95.5%,综合得分0.83,表现优异 [26] - 消融实验表明,使用16个场景查询在性能与效率间取得最佳平衡 [27] - 可视化显示场景查询能根据不同导航指令自适应关注与驾驶意图相关的区域,证明了可学习感知模块的有效性 [28] - 该方案被视为端到端感知的“AlexNet时刻”,标志着可学习感知模块首次大幅超越人为定义感知模块,可能引导行业新方向 [29]
正式结课!工业界大佬带队三个月搞定端到端自动驾驶
自动驾驶之心· 2025-10-27 00:03
端到端自动驾驶技术发展现状 - 2023年是端到端量产的元年,2025年将是端到端量产的大年,目前头部新势力和主机厂端到端技术均已实现量产[1] - 工业界存在一段式和两段式两种主要技术范式,一段式代表UniAD直接从传感器输入建模自车轨迹输出,二段式基于感知结果进一步输出自车和他车轨迹[1] - 2024年以来一段式端到端快速发展,衍生出基于感知、世界模型、扩散模型和VLA等多种一段式方法[3] 端到端自动驾驶技术体系 - 端到端与VLA技术涉及BEV感知、视觉语言模型VLM、扩散模型、强化学习等核心内容[5] - 主流自动驾驶企业包括智驾方案供应商和车企都在发力端到端自动驾驶的自研量产[3] - 技术栈涵盖学术界和工业界最前沿的方法,二段式端到端与一段式端到端前沿算法都是工业界和学术界的Baseline[5] 端到端自动驾驶课程内容 - 课程第一章介绍端到端发展历史、技术范式演变及优缺点,分析学术界和工业界研究方向[9] - 第二章重点讲解端到端背景知识,包括VLA涉及的大语言模型、扩散模型、强化学习,以及一段式端到端涉及的BEV感知[9] - 第三章聚焦二段式端到端,讲解经典算法PLUTO、CVPR'25的CarPlanner和最新工作Plan-R1[10] - 第四章涵盖一段式端到端子领域:基于感知的UniAD、基于世界模型、基于扩散模型和基于VLA的方法[12] - 课程大作业选择RLHF微调实战,涵盖预训练模块搭建、强化学习模块搭建和实验实施[13] 端到端自动驾驶技术细节 - 基于感知的方法讲解UniAD和地平线VAD,以及CVPR'24的PARA-Drive[14] - 基于世界模型的方法介绍AAAI'25的Drive-OccWorld和复旦团队的OccLLaMA,探讨世界模型在场景生成、端到端和闭环仿真中的应用[14] - 基于扩散模型的方法讲解DiffusionDrive、Diffusion Planner和吉大DiffE2E,配套Diffusion Planner实战[14] - 基于VLA的方法选取小米ORION、慕尼黑工大OpenDriveVLA和最新ReCogDrive,以ORION作为实战案例[14] 端到端自动驾驶学习目标 - 课程是首个面向端到端自动驾驶的进阶实战教程,旨在推动端到端在工业界落地[15] - 学员学完后能达到1年左右端到端自动驾驶算法工程师水平,掌握端到端技术框架和关键技术[19] - 学习成果包括可复现扩散模型、VLA等主流算法框架,并能将所学应用到实际项目中[19]
模仿学习无法真正端到端?
自动驾驶之心· 2025-10-08 23:33
模仿学习的核心问题与局限性 - 模仿学习的基本假设是专家数据提供了最优行为真值,但在驾驶这种多模态场景中不存在唯一完美驾驶行为 [2] - 训练数据来源于风格、技术和礼让程度各异的真人驾驶,这些数据缺乏一致性且难以称为最优,导致模型学不到清晰正确的驾驶逻辑 [3] - 纯粹基于模仿学习的模型难以学到具有强逻辑和因果关系的拟人驾驶策略,反而表现出极强的随机性和不确定性 [4] 模仿学习在决策权重上的缺陷 - 模仿学习将人驾数据中每个时刻的真值正确性视为等权重,无法区分关键场景决策与普通场景决策的重要性 [5] - 由于训练阶段没有对不同的场景决策区别对待,模型在关键时刻容易犯下致命错误,导致输出不可完全信赖 [5] - 自动驾驶领域充满关键场景,纯粹模仿学习系统在一般场景可能表现良好,但在关键场景(如旁车紧急切入)则难以输出符合安全要求的轨迹 [7] 模仿学习的累积误差与分布外问题 - 开环模仿学习会因Policy与最优解之间的微小误差累积,导致自车进入训练数据分布之外的驾驶状态 [8] - 当模型进入人驾数据中罕见的驾驶状态时,其行为难以预判,造成性能显著下降 [8][12] - 实车表现上,模型可能因非最优行为导致迟迟不能变道,而很晚变道的现象在人驾数据中少见,最终在关键时刻容易放弃并导致接管 [13] 技术研发的关键方向 - 技术研发的核心在于识别关键路线和瓶颈,而非紧追技术潮流 [14] - 随着端到端技术方案实践经验的增长,行业意识到问题在于寻找模仿学习训练范式之外的新方法来解决其技术瓶颈 [14]
死磕技术的自动驾驶黄埔军校,三年了~
自动驾驶之心· 2025-08-28 03:22
社区规模与愿景 - 自动驾驶之心知识星球是一个集视频、图文、学习路线、问答、求职交流为一体的综合类自驾社区 目前成员超过4000人 未来2年目标规模达到近万人[1] 技术资源覆盖 - 社区内部梳理了近40+自动驾驶技术路线 覆盖端到端自动驾驶、多模态大模型、VLA benchmark等热门方向[2][5] - 汇总近40+开源项目、近60+自动驾驶相关数据集以及行业主流仿真平台[13] - 包含国内高校著名自动驾驶团队整理、自动驾驶领域企业介绍、会议及数据集与标定工具等资源[6] 行业专家与交流 - 邀请数十位活跃在一线产业界和工业界的自动驾驶领域嘉宾 包括经常出现在顶会和访谈中的大佬[2] - 不定期与学术界和工业界大佬畅聊自动驾驶发展趋势 探讨技术走向和量产痛点[4][62] - 社区成员来自上海交大、北京大学、CMU、清华大学及蔚小理、地平线、华为等头部高校和企业[13] 学习路线与课程 - 提供全栈方向学习课程 非常适合0基础小白[7] - 详细梳理端到端自动驾驶学习路线 包括一段式/二段式量产方案应用[16][31] - 涵盖自动驾驶感知、仿真、规划控制学习路线 以及VLA、多模态大模型、3DGS等前沿技术[13][31][36] 求职与内推机制 - 与多家自动驾驶公司建立岗位内推机制 可第一时间将简历送至心仪公司[9] - 社区内部讨论涵盖职业规划、offer选择、实习建议等求职相关问题[61] - 汇总自动驾驶领域企业介绍及国内外各类自动驾驶相关机器人公司[24][28] 前沿技术讨论 - 端到端自动驾驶作为学术界和工业界研究热点 社区详细梳理相关算法、量产方案及数据集[31][63] - 聚焦视觉语言模型(VLM) 汇总最新综述、开源数据集及思维链推理等内容[34][35] - 覆盖扩散模型、世界模型、3D目标检测、多传感器融合等当前研究热点[38][40][42] 直播与专业分享 - 社区内部已举办超过一百场专业技术直播 邀请行业大佬分享最新工作[57] - 直播内容涵盖VLA模型、3D检测基础模型、扩散规划算法等前沿技术[57] - 会员可独享世界模型、自动驾驶大模型、Transformer等七大福利视频教程[54]
最近被公司通知不续签了。。。
自动驾驶之心· 2025-08-17 03:23
智能驾驶行业现状 - 行业已进入拼技术和成本的关键期 2024年多家智驾公司未能存活 当前行业壁垒持续提高[2] - 价格战被国家叫停 但行业竞争依然激烈[6] - 小鹏汽车等头部企业形势好转 找到明确发展路径[6] 技术发展趋势 - 传统规划控制技术趋于成熟 面临端到端量产技术冲击[6][7] - BEV感知、端到端控制、扩散模型、模仿学习和强化学习成为新兴技术方向[8] - 具身智能和机器人规控领域出现新机会 技术栈与自动驾驶相通[8] - 视觉语言模型(VLM)和自动驾驶大模型成为2025年重点发展方向[49][83] 人才需求变化 - 社招要求扎实的工程能力、领域深度和量产落地经验[8] - 传统规控工程师需要更新技术栈 学习模型算法[7] - 去年至今已有十几位规控工程师成功转型端到端和大模型方向[8] - 六年工作经验仍处于职业转型窗口期[8] 知识体系架构 - 社区整理40+技术路线 涵盖感知、仿真、规划控制等方向[10][19] - 包含近60+自动驾驶数据集和行业主流仿真平台[19] - 提供BEV感知、扩散模型、世界模型等前沿技术学习路径[19][22] - 汇总100问系列包括TensorRT部署、毫米波雷达融合、规划控制等实战问题[12] 行业资源整合 - 汇集国内外知名高校自动驾驶团队和头部企业资源[19][31][33] - 整理自动驾驶多模态大模型预训练和微调数据集[39] - 汇总3D目标检测、Occupancy Network、在线高精地图等关键技术方案[37][54][60] - 提供模型压缩、部署优化等工程化实践内容[12] 学术产业联动 - 举办超过100场专业技术直播 邀请产业界和学术界专家分享[86] - 涵盖V2X、3D检测、扩散模型规划器等前沿主题[86] - 提供学术界和工业界研究成果交流平台[10][19] - 实时更新顶会最新研究和工业落地应用[27]
传统感知和规控,打算转端到端VLA了...
自动驾驶之心· 2025-07-28 03:15
端到端VLA技术发展现状 - 端到端自动驾驶技术分为一段式与二段式两大方向 一段式包括基于感知(UniAD)、世界模型(OccWorld)、扩散模型(DiffusionDrive)等子领域 二段式以PLUTO为代表 [2] - 基于VLM的方法推动自动驾驶进入大模型时代 形成VLA(Vision-Language-Action)新方向 传统BEV感知、多传感器融合等技术已相对成熟 学术界研究热点明显转移 [2] - 工业界仍在优化传统感知规划方案 但学术界研究资源已集中投向大模型与VLA领域 该领域存在大量待探索的子方向 [2] VLA科研辅导课程设计 - 课程采用"2+1"多师制 主导师由名校教授/行业专家担任 配备科研班主任全程督导 包含12周在线科研+2周论文指导+10周维护期 [11][14] - 提供完整科研闭环支持:从经典/前沿论文分析(PLUTO/UniAD等)、baseline代码(VAD/DiffusionDrive等开源项目)、数据集(nuScenes/Waymo)到论文写作投稿全流程 [8][18] - 硬件要求最低配置4张NVIDIA 4090显卡 推荐8张 支持云服务器租赁方案 [12] 目标学员与课程产出 - 面向本硕博学生 需掌握Python/PyTorch基础 通过1v1面试考核 课程包含先修课强化深度学习与自动驾驶算法基础 [6][12] - 学员将获得:论文初稿(含导师定制idea)、结业证书、推荐信(优秀者) 以及系统的科研方法论与coding能力提升 [11][15] - 解决三大核心痛点:知识碎片化问题(建立VLA体系)、动手能力差问题(复现SOTA模型)、论文写作障碍(提供写作模板与投稿策略) [7] 技术资源支持 - 开源框架覆盖主流技术路线:基于模仿学习(UniAD/VAD)、扩散模型(DiffusionDrive/OccNet)、VLA(OpenDriveVLA/SimLingo)等 [18] - 必读论文包括Senna(视觉语言模型与自动驾驶桥接)、ORION(语言指令生成行动框架)等5篇顶会前沿研究 [18] - 采用腾讯会议直播+小鹅通回放形式 提供6个月答疑周期 严格学术诚信要求(剽窃零容忍) [14][20][21]
传统规控和端到端岗位的博弈......(附招聘)
自动驾驶之心· 2025-07-10 03:03
行业技术趋势 - 端到端自动驾驶技术正快速冲击传统规控方法 其场景泛化能力和数据驱动特性显著优于基于规则的系统 [2] - 传统规控依赖人工编写规则(PID/LQR/MPC等算法) 优势在于可解释性强但难以覆盖所有场景 [2] - 端到端方案直接从传感器映射控制指令 减少模块化架构的信息损失 实现全局优化 [4] 技术方案对比 端到端方案 - 优势:降低系统复杂性 通过数据学习人类驾驶风格 支持全流程联合优化 [4] - 劣势:决策过程黑箱化 需海量训练数据 极端场景依赖规则兜底 [4] 传统PNC方案 - 优势:模块功能明确 已知场景稳定性高 适合高安全需求场景 [5] - 劣势:多模块协同开发成本高 复杂场景规则覆盖有限 依赖高精地图 [5] 技术融合方向 - 行业实践表明端到端与PNC呈互补关系 如华为ADAS3.0采用传统规控作为安全冗余 [6] - 传统规控工程师转型需结合端到端技术 复合型人才更具竞争力 [7] 人才需求现状 规控算法工程师 - 岗位职责覆盖城区/高速/停车场等多场景决策规划算法开发 需掌握MPC/PID等经典算法 [10] - 任职要求硕士以上学历 熟悉强化学习算法 有Apollo等开源项目经验者优先 [10] - 薪资范围40k-100k/月 工作地集中在北京/上海 [10] 端到端工程师 - 核心任务包括VLA模型构建、训练数据集优化及闭环评测系统研发 [12] - 薪资30k-80k/月 工作地分布在深圳/上海 [12] 视觉算法专家 - 技术要求涵盖轻图感知、占据格网络研发及视觉大模型应用开发 [18] - 优先考虑有顶会论文或算法竞赛获奖经历者 薪资40k-80k/月 [17][18]