Workflow
端到端和VLA
icon
搜索文档
端到端和VLA的岗位,三年经验月薪到70k了
自动驾驶之心· 2025-11-14 00:04
行业人才需求 - 主机厂和供应商对端到端和视觉语言动作模型技术人才需求旺盛[1] - 招聘网站上3-5年经验的专家岗位月薪高达70k[1] 技术发展趋势 - 自动驾驶技术正从模块化量产算法向端到端和视觉语言动作模型发展[1] - 核心算法涉及BEV感知、视觉语言模型、扩散模型、强化学习和世界模型等前沿领域[1] 课程内容设置 视觉语言动作模型与大模型实战课程 - 课程涵盖视觉语言模型作为自动驾驶解释器、模块化视觉语言动作模型、一体化视觉语言动作模型和推理增强视觉语言动作模型三大领域[2] - 配套理论基础包括视觉/语言/动作三大模块、强化学习和扩散模型等内容[2] - 设置大作业章节指导学员从零搭建自己的视觉语言动作模型和数据集[2] 端到端与视觉语言动作模型自动驾驶课程 - 重点讲解一段式/两段式端到端自动驾驶算法的重点内容和理论基础[11] - 详细解析BEV感知、大语言模型、扩散模型和强化学习技术[11] - 设置两大实战项目:基于扩散模型的规划器和基于视觉语言动作模型的ORION算法[11] 师资团队构成 - 教师团队来自清华大学等顶尖高校和国内顶级主机厂[7][10][13] - 团队成员在ICCV、IROS、EMNLP等国际顶级会议发表多篇论文[7][10][13] - 具备丰富的自动驾驶感知、大模型框架工具开发和算法量产交付经验[7][10][13] 学员入学要求 - 需要自备GPU设备,推荐算力在4090及以上[14] - 要求具备自动驾驶领域基础知识和Transformer大模型、强化学习、BEV感知等技术概念[15] - 需要概率论、线性代数基础和Python、PyTorch编程能力[15]