Workflow
端到端自动驾驶技术
icon
搜索文档
死磕技术的自动驾驶黄埔军校,三年了~
自动驾驶之心· 2025-08-28 03:22
社区规模与愿景 - 自动驾驶之心知识星球是一个集视频、图文、学习路线、问答、求职交流为一体的综合类自驾社区 目前成员超过4000人 未来2年目标规模达到近万人[1] 技术资源覆盖 - 社区内部梳理了近40+自动驾驶技术路线 覆盖端到端自动驾驶、多模态大模型、VLA benchmark等热门方向[2][5] - 汇总近40+开源项目、近60+自动驾驶相关数据集以及行业主流仿真平台[13] - 包含国内高校著名自动驾驶团队整理、自动驾驶领域企业介绍、会议及数据集与标定工具等资源[6] 行业专家与交流 - 邀请数十位活跃在一线产业界和工业界的自动驾驶领域嘉宾 包括经常出现在顶会和访谈中的大佬[2] - 不定期与学术界和工业界大佬畅聊自动驾驶发展趋势 探讨技术走向和量产痛点[4][62] - 社区成员来自上海交大、北京大学、CMU、清华大学及蔚小理、地平线、华为等头部高校和企业[13] 学习路线与课程 - 提供全栈方向学习课程 非常适合0基础小白[7] - 详细梳理端到端自动驾驶学习路线 包括一段式/二段式量产方案应用[16][31] - 涵盖自动驾驶感知、仿真、规划控制学习路线 以及VLA、多模态大模型、3DGS等前沿技术[13][31][36] 求职与内推机制 - 与多家自动驾驶公司建立岗位内推机制 可第一时间将简历送至心仪公司[9] - 社区内部讨论涵盖职业规划、offer选择、实习建议等求职相关问题[61] - 汇总自动驾驶领域企业介绍及国内外各类自动驾驶相关机器人公司[24][28] 前沿技术讨论 - 端到端自动驾驶作为学术界和工业界研究热点 社区详细梳理相关算法、量产方案及数据集[31][63] - 聚焦视觉语言模型(VLM) 汇总最新综述、开源数据集及思维链推理等内容[34][35] - 覆盖扩散模型、世界模型、3D目标检测、多传感器融合等当前研究热点[38][40][42] 直播与专业分享 - 社区内部已举办超过一百场专业技术直播 邀请行业大佬分享最新工作[57] - 直播内容涵盖VLA模型、3D检测基础模型、扩散规划算法等前沿技术[57] - 会员可独享世界模型、自动驾驶大模型、Transformer等七大福利视频教程[54]
最近被公司通知不续签了。。。
自动驾驶之心· 2025-08-17 03:23
智能驾驶行业现状 - 行业已进入拼技术和成本的关键期 2024年多家智驾公司未能存活 当前行业壁垒持续提高[2] - 价格战被国家叫停 但行业竞争依然激烈[6] - 小鹏汽车等头部企业形势好转 找到明确发展路径[6] 技术发展趋势 - 传统规划控制技术趋于成熟 面临端到端量产技术冲击[6][7] - BEV感知、端到端控制、扩散模型、模仿学习和强化学习成为新兴技术方向[8] - 具身智能和机器人规控领域出现新机会 技术栈与自动驾驶相通[8] - 视觉语言模型(VLM)和自动驾驶大模型成为2025年重点发展方向[49][83] 人才需求变化 - 社招要求扎实的工程能力、领域深度和量产落地经验[8] - 传统规控工程师需要更新技术栈 学习模型算法[7] - 去年至今已有十几位规控工程师成功转型端到端和大模型方向[8] - 六年工作经验仍处于职业转型窗口期[8] 知识体系架构 - 社区整理40+技术路线 涵盖感知、仿真、规划控制等方向[10][19] - 包含近60+自动驾驶数据集和行业主流仿真平台[19] - 提供BEV感知、扩散模型、世界模型等前沿技术学习路径[19][22] - 汇总100问系列包括TensorRT部署、毫米波雷达融合、规划控制等实战问题[12] 行业资源整合 - 汇集国内外知名高校自动驾驶团队和头部企业资源[19][31][33] - 整理自动驾驶多模态大模型预训练和微调数据集[39] - 汇总3D目标检测、Occupancy Network、在线高精地图等关键技术方案[37][54][60] - 提供模型压缩、部署优化等工程化实践内容[12] 学术产业联动 - 举办超过100场专业技术直播 邀请产业界和学术界专家分享[86] - 涵盖V2X、3D检测、扩散模型规划器等前沿主题[86] - 提供学术界和工业界研究成果交流平台[10][19] - 实时更新顶会最新研究和工业落地应用[27]
传统感知和规控,打算转端到端VLA了...
自动驾驶之心· 2025-07-28 03:15
端到端VLA技术发展现状 - 端到端自动驾驶技术分为一段式与二段式两大方向 一段式包括基于感知(UniAD)、世界模型(OccWorld)、扩散模型(DiffusionDrive)等子领域 二段式以PLUTO为代表 [2] - 基于VLM的方法推动自动驾驶进入大模型时代 形成VLA(Vision-Language-Action)新方向 传统BEV感知、多传感器融合等技术已相对成熟 学术界研究热点明显转移 [2] - 工业界仍在优化传统感知规划方案 但学术界研究资源已集中投向大模型与VLA领域 该领域存在大量待探索的子方向 [2] VLA科研辅导课程设计 - 课程采用"2+1"多师制 主导师由名校教授/行业专家担任 配备科研班主任全程督导 包含12周在线科研+2周论文指导+10周维护期 [11][14] - 提供完整科研闭环支持:从经典/前沿论文分析(PLUTO/UniAD等)、baseline代码(VAD/DiffusionDrive等开源项目)、数据集(nuScenes/Waymo)到论文写作投稿全流程 [8][18] - 硬件要求最低配置4张NVIDIA 4090显卡 推荐8张 支持云服务器租赁方案 [12] 目标学员与课程产出 - 面向本硕博学生 需掌握Python/PyTorch基础 通过1v1面试考核 课程包含先修课强化深度学习与自动驾驶算法基础 [6][12] - 学员将获得:论文初稿(含导师定制idea)、结业证书、推荐信(优秀者) 以及系统的科研方法论与coding能力提升 [11][15] - 解决三大核心痛点:知识碎片化问题(建立VLA体系)、动手能力差问题(复现SOTA模型)、论文写作障碍(提供写作模板与投稿策略) [7] 技术资源支持 - 开源框架覆盖主流技术路线:基于模仿学习(UniAD/VAD)、扩散模型(DiffusionDrive/OccNet)、VLA(OpenDriveVLA/SimLingo)等 [18] - 必读论文包括Senna(视觉语言模型与自动驾驶桥接)、ORION(语言指令生成行动框架)等5篇顶会前沿研究 [18] - 采用腾讯会议直播+小鹅通回放形式 提供6个月答疑周期 严格学术诚信要求(剽窃零容忍) [14][20][21]
传统规控和端到端岗位的博弈......(附招聘)
自动驾驶之心· 2025-07-10 03:03
行业技术趋势 - 端到端自动驾驶技术正快速冲击传统规控方法 其场景泛化能力和数据驱动特性显著优于基于规则的系统 [2] - 传统规控依赖人工编写规则(PID/LQR/MPC等算法) 优势在于可解释性强但难以覆盖所有场景 [2] - 端到端方案直接从传感器映射控制指令 减少模块化架构的信息损失 实现全局优化 [4] 技术方案对比 端到端方案 - 优势:降低系统复杂性 通过数据学习人类驾驶风格 支持全流程联合优化 [4] - 劣势:决策过程黑箱化 需海量训练数据 极端场景依赖规则兜底 [4] 传统PNC方案 - 优势:模块功能明确 已知场景稳定性高 适合高安全需求场景 [5] - 劣势:多模块协同开发成本高 复杂场景规则覆盖有限 依赖高精地图 [5] 技术融合方向 - 行业实践表明端到端与PNC呈互补关系 如华为ADAS3.0采用传统规控作为安全冗余 [6] - 传统规控工程师转型需结合端到端技术 复合型人才更具竞争力 [7] 人才需求现状 规控算法工程师 - 岗位职责覆盖城区/高速/停车场等多场景决策规划算法开发 需掌握MPC/PID等经典算法 [10] - 任职要求硕士以上学历 熟悉强化学习算法 有Apollo等开源项目经验者优先 [10] - 薪资范围40k-100k/月 工作地集中在北京/上海 [10] 端到端工程师 - 核心任务包括VLA模型构建、训练数据集优化及闭环评测系统研发 [12] - 薪资30k-80k/月 工作地分布在深圳/上海 [12] 视觉算法专家 - 技术要求涵盖轻图感知、占据格网络研发及视觉大模型应用开发 [18] - 优先考虑有顶会论文或算法竞赛获奖经历者 薪资40k-80k/月 [17][18]
黄仁勋:英伟达正在将其AI模型应用于自动驾驶汽车
快讯· 2025-05-19 04:29
英伟达AI技术应用 - 公司正在将AI模型应用于自动驾驶汽车领域 [1] - 与梅赛德斯合作在全球范围部署自动驾驶车队 [1] - 采用端到端自动驾驶技术并计划今年实现商业化落地 [1] 行业合作动态 - 英伟达与梅赛德斯建立战略合作关系共同推进自动驾驶技术 [1] - 合作涉及全球范围内的车队部署计划 [1]