自动驾驶

搜索文档
当导师让我去看多模态感知研究方向后......
自动驾驶之心· 2025-09-07 23:34
自动驾驶多模态感知融合技术发展现状 - 激光雷达在自动驾驶感知中具有核心优势:提供超长感知距离的安全冗余、高帧率实时感知、恶劣环境抗干扰保障和三维空间认知能力 [1] - 多传感器融合是国内高端智能驾驶量产的主流范式 激光雷达与视觉感知结合构成可靠工作能力 [1] - 多模态感知融合技术正从传统融合向端到端融合和Transformer架构演进 [1] 多模态融合技术架构演进 - 传统融合分为三种方式:早期融合(输入端拼接原始数据 计算量巨大) 中期融合(传感器特征提取后融合 当前主流方案) 后融合(决策层结果融合 可解释性强但难以解决信息冲突) [2] - 基于Transformer的端到端融合成为最前沿方向:通过跨模态注意力机制学习不同模态深层关系 实现高效鲁棒的特征交互 [2] - 端到端训练减少中间模块误差累积 直接从原始传感器数据输出3D目标框 提升动态信息捕捉能力和整体性能 [2] 多模态融合科研培训课程体系 - 课程设计为期14周:包含12周在线小组科研 2周论文指导和10周论文维护期 [10][21] - 招生规模为6人/期 至多8人 采用"2+1"式师资配置(名校教授+行业导师+科研班主任) [5][11] - 硬件要求最低2张4090显卡 推荐4张4090或以上性能设备 支持云服务器租赁 [11] 课程技术内容体系 - 覆盖多模态融合全技术栈:从传统模块化感知系统到BEV视角融合 再到基于Transformer的端到端融合 [15] - 提供完整科研支持:包括公开数据集(nuScenes、KITTI、Waymo Open Dataset)、Baseline代码和论文idea [12][13][14] - 重点讲解激光-视觉深度融合和雷达-视觉-激光三元融合技术 涵盖多任务多传感器融合方案 [15][16] 学术产出与培养目标 - 学员将产出论文初稿 获得结业证书和推荐信(根据优秀程度) [11] - 培养体系解决三大问题:知识体系碎片化 动手能力不足 论文写作投稿困难 [5] - 课程包含完整论文方法论:从选题方法、实验方法到写作方法和投稿建议 [4][10]
1.5万元“压垮”中智行,自动驾驶行业分化与重生
北京商报· 2025-09-07 13:51
公司破产事件 - 中智行因1.5万元劳动仲裁款未支付被申请破产清算 法院调查显示公司资不抵债且无法联系[1][3] - 公司涉及多件执行案件 涉案金额达2208.75万元 其中66.6%案件作为被告 53.33%案件发生在2025年[3] - 公司员工人数为0 法定代表人已变更 官方电话为空号 公众号于2024年2月停止更新[3] 技术路线分析 - 中智行采用车路协同技术路线 需依赖城市基础设施建设 成本极高且泛化性差[6] - 行业主流技术路线为单车智能 通过车载传感器实现独立感知 中国量产辅助驾驶车辆均未采用车路协同[6] - 车路协同模式导致中智行投入大量研发资金但无法获得收入[6] 行业分化现象 - 自动驾驶行业出现结构性分化 资本从概念追逐转向聚焦头部企业[7] - 行业并非整体收缩 头部企业通过成本控制、场景突围和全球化布局实现商业化突破[1] - 中智行破产被视为技术路线与商业现实博弈的分水岭[1] 同业公司表现 - 文远知行2025年二季度Robotaxi业务营收4590万元 同比增长836.7% 占总营收36.1%[7] - 百度萝卜快跑同期提供超220万次出行服务 同比增长148% 累计服务超1400万次 覆盖全球16城[7] - 小马智行Robotaxi业务营收1090万元 同比增长157.8% 其中乘客车费营收同比增长超300%[8] 财务数据对比 - 文远知行2025年二季度总营收1.27亿元 同比增长60.8% 调整后净亏损3.01亿元 同比扩大72.2%[8] - 小马智行同期营收1.54亿元 同比增长75.9% 非国际会计准则净亏损3.3亿元 同比扩大34.3%[8] 行业现状评估 - 无人驾驶技术仍处快速发展阶段 面临技术成熟度、法律法规和公众接受度等多重挑战[8] - 持续技术研发和市场拓展成本巨大 头部企业虽实现增长但尚未完全安全[8] - 技术落地能力比上市地位更重要 具备实际应用前景的企业更有发展潜力[8]
湾财周报 人物 曾执掌证监会5年,易会满被查
南方都市报· 2025-09-07 11:13
易会满被查事件 - 十四届全国政协经济委员会副主任易会满涉嫌严重违纪违法接受中央纪委国家监委调查 [1] - 易会满曾任职中国工商银行副行长(2008年5月至2013年5月)、行长(2013年5月-2016年5月)、党委书记兼董事长(2016年5月-2019年1月) [1] - 2019年1月至2024年2月担任中国证监会党委书记、主席期间推动A股全面注册制改革 [1] 资本市场改革成果 - 科创板于2019年7月率先试点注册制 创业板于2020年8月改革并试点注册制 [1] - 易会满任期内A股新上市公司数量超过1900家 逼近2000家 [2] 自动驾驶行业发展 - 小马智行CEO彭军入选《时代》周刊2025年度全球AI领域100位最具影响力人物 [3] - 自动驾驶作为AI技术最复杂的集成应用之一获得全球层面战略重视 [3] 深圳产业投资动态 - 深圳集体经济发起两只创投基金总规模达3亿元 存续期10年 [4] - 坂田人工智能创投基金和龙岗龙兴创投基金拟投向人工智能为先导的战略性新兴产业 [4] 房地产企业诉讼进展 - 美国法院一审判决要求梁家荣赔偿世荣兆业本金及利息共21.9亿元 [5] - 世荣兆业与梁家荣的跨国诉讼涉及28亿元追债 [5] 跨国企业高管变动 - 雀巢集团CEO傅乐宏因违反商业行为准则被解职 任职仅1年 [6] - 咖啡业务负责人菲利普·纳夫拉蒂尔接任雀巢CEO [6] - 三得利CEO新浪刚史因涉嫌获取违法海外药品辞职 正接受警方调查 [6] 汽车行业人事调整 - 荣耀前CMO姜海荣出任深蓝汽车CEO 原CEO邓承浩升任董事长 [7] - 此次人事变动旨在补齐新能源汽车品牌与营销短板 [7] 银行业经营状况 - 42家A股上市银行2025年上半年营业收入同比增速1.0% 归母净利润同比增速0.8% [8] - 股份行阵营营收增速-2.3% 归母净利润增速0.3% 面临息差收窄压力 [8] 金融机构人事任命 - 朱斌晨任建设银行广东省分行行长 曾任建行陕西省分行行长 [9] - 周权出任中银证券董事长、党委书记及法定代表人 [10] - 谢志斌获批担任中信百信银行董事长 系中信银行副行长 [12] - 李世宏获批担任国宝人寿董事长 曾任四川省财政厅副厅长 [13] 央企管理层调整 - 张振高卸任华侨城集团党委书记、董事长职务 达到央企退休年龄上限 [11] - 吴秉琪被任命为华侨城集团党委副书记、董事 并提名为总经理人选 [11]
丰田和松下在中美对立中寻找商机
日经中文网· 2025-09-07 00:32
丰田战略转型与软件平台发展 - 公司为2025年度上市的新款SUV RAV4配备自主开发的软件平台Arene 可通过软件控制车辆行驶相关的安全功能和性能 [4] - 公司自动驾驶技术此前倾向于自主开发 但自动驾驶负责人表示技术领域广泛无法全部自主开发 将利用其他企业技术创造乘积效应 [6] - 公司认为美国企业拥有的丰富行驶数据将成为自动驾驶开发的关键 推动公司变化的是人工智能进步和数据利用 [6] 日企在美国自动驾驶市场的合作布局 - 丰田与Alphabet旗下Waymo在自动驾驶领域达成基本协议 将联合开发用于打车服务的车辆平台 在Waymo自动驾驶出租车服务中引进丰田车辆 [6] - 丰田从英伟达采购适合自动驾驶开发的最新半导体 [6] - 松下汽车系统2023年与亚马逊AWS合作推动新一代汽车软件开发 通过云平台实现无硬件软件开发 提高开发效率并向美国汽车厂商提出建议 [8] 美国自动驾驶市场前景与政策环境 - 高盛研究预测北美自动驾驶市场到2030年将达73亿美元 是2025年的20倍 其中8%网约车市场将采用自动驾驶汽车 [9] - 美国推行关税和数据限制等"内向"政策成为东风 自动驾驶涉及面部识别和位置信息等机密数据 在美国国内增加开发成为趋势 [12] - 数据管制日益严格 开发策略倾向于不将数据带出地区 在数据集中地区进行开发 [12] 日本汽车产业技术现状与挑战 - 日本汽车产业在发动机等车辆技术领先 但在软件方面落后 高速公路等基础设施数据与车辆数据融合难以推进 [12] - 在AI开发竞争主导的美国自动驾驶市场 能否转换以日本式技术开发为核心的思路成为课题 [12] - 日本企业将中美对立导致中国企业影响力减弱视为商机 摆脱闭门主义并从企业合作中寻找活路 [2]
自动驾驶中有“纯血VLA"吗?盘点自动驾驶VLM到底能起到哪些作用~
自动驾驶之心· 2025-09-06 16:05
视觉语言自动驾驶模型技术实现 - 模型支持不同数量相机输入 无需明确指定相机数量[2] - 轨迹输出采用文本形式 通过Prompt限制为XY坐标格式[4] - 输出坐标为车辆坐标系相对值 原点为(0,0) 非图像坐标[6] - 使用Python编程进行轨迹格式规范化处理 确保输出符合预期[8] - 通过JSON格式和关键词约束优化未经训练模型的输出效果[9] 数据集构建与处理 - 遇到坐标异常问题 连续多帧坐标相同后出现突变[14] - 不同数据集存在坐标格式差异 包括经纬度与相对坐标[14] - 通过规则化方法剔除不合理轨迹数据[14] - 统一转换为自车坐标系下的相对位移进行数据对齐[18] - 输入为图像和前1.5秒轨迹点 输出未来5秒轨迹点[20] 模型训练与性能 - 经过数据训练后模型输出格式符合性显著提升[8] - 通过QA训练获得多模态轨迹预测和场景理解能力[11] - 具备动态物体轨迹预测能力 包括车辆行人运动预测[11] - 新增端到端预测任务确保数据完整性[20] 社区资源与技术覆盖 - 知识星球涵盖40+技术方向包括多模态大模型和端到端自动驾驶[22] - 社区成员来自头部自驾公司和高校实验室 超4000人规模[24] - 提供近40个技术路线图和学习入门路线[24] - 包含自动驾驶数据集汇总与仿真工具资源[27] - 建立与多家自动驾驶公司的岗位内推机制[29]
理想汽车智驾方案World model + 强化学习重建自动驾驶交互环境
自动驾驶之心· 2025-09-06 16:05
自动驾驶仿真技术突破 - 融合几何先验的生成式闭环仿真框架DrivingSphere构建4D世界表示 将静态背景与动态对象融合为占用网格 解决开环仿真缺乏动态反馈及传统闭环仿真视觉真实性问题[8] - 首次结合文本提示与BEV地图驱动3D占用生成 通过场景扩展机制实现城市级静态场景的无限扩展[8] - 通过OccDreamer扩散模型基于BEV地图与文本提示生成城市级3D静态场景 突破传统方法对固定数据集的依赖[17] 多维度仿真能力提升 - 动态环境组成模块通过OccDreamer扩散模型与动作动态管理构建包含静态背景与动态主体的4D驾驶世界[13] - 视觉场景合成模块通过VideoDreamer将4D占用数据转换为高保真多视图视频 支持自动驾驶系统感知测试[21] - 采用时空扩散Transformer(ST-DiT)架构 集成视图感知空间自注意力机制处理多视图特征空间一致性 时间自注意力确保动作连续性[22][26] 闭环反馈机制创新 - 通过自动驾驶代理与模拟环境双向交互形成"代理动作-环境响应"实时循环 支持真实场景算法验证[23] - 交通流引擎实现大规模智能体协同 支持十字路口通行等复杂场景仿真[23][27] - 支持"仿真-测试-优化"迭代流程 通过闭环反馈暴露算法缺陷并指导模型改进[23] 技术整合与论文支撑 - 理想团队在CVPR2025发表四篇论文:StreetCrafter、DrivingSphere、DriveDreamer4D与ReconDreamer 提供自动驾驶场景重建与生成的技术细节[5][30] - 占用标记器使用VQVAE将3D占用数据映射为潜在特征 通过组合损失函数优化重建精度[20] - 条件编码机制整合全局几何特征/智能体ID与位置编码/文本描述嵌入 确保生成视频的语义准确性与外观一致性[26]
自动驾驶之心开学季火热进行中,所有课程七折优惠!
自动驾驶之心· 2025-09-06 16:05
值此开学季之际,我们为大家准备了重磅学习礼包: 1. 重磅推出299元超级折扣卡(一年期有效):购买后,享受全平台课程七折优惠; 2. 自动驾驶之心知识星球立减88; 3. 课程福利放送:满1000元赠送2门带读课程(八选二); 4. 自动驾驶论文辅导1000最高抵扣10000; 5. 自动驾驶1v6小班课限时福利立减1000; 6. 全平台硬件优惠: 全栈教研平台黑武士001 足式/强化学习科研平台:TRON1 四足机械狗+机械臂科研平台 桌面级机械臂科研平台 数采夹爪(单臂+双臂方案) 超级折扣卡 重点介绍下我们最新推出的超级折扣卡!活动期间购买有效, 自购买之日起一年时间内,购买平台任意课程均享受七折优惠,包括后续推出的新课程呦~ 自动驾驶前沿课程 2025年我们重点推荐以下自动驾驶技术方向。 1)端到端与VLA自动驾驶 端到端自动驾驶(End-to-End Autonomous Driving)作为目前智驾量产的核心算法,可以分为一段式端到端、二段式端到端两个大的技术方向。自UniAD获得 CVPR Best Paper以来,正式拉开了国内新一轮的智驾军备竞赛。2024年理想汽车更是宣布E2E+VLM ...
谈谈Diffusion扩散模型 -- 从图像生成到端到端轨迹规划~
自动驾驶之心· 2025-09-06 11:59
扩散模型技术原理 - 扩散模型是一种生成式模型 本质是通过去噪过程学习数据分布 噪音符合特定分布 [1] - 模型原理基于对数据分布的学习和模拟 包含正向扩散过程和反向生成过程 [2] - 开山之作自2020年提出 目前引用量已超过20000次 [2] 扩散模型在自动驾驶领域的应用 - 应用主要集中在数据生成 场景预测 感知增强和路径规划等方面 [11] - 可对连续分布噪音和离散分布噪音进行去噪 适用于决策规划等离散问题 [11] - 在端到端和VLA架构中都发挥重要作用 [11] 端到端自动驾驶课程技术体系 - 课程涵盖多模态大模型 BEV感知 强化学习 视觉Transformer 扩散模型等核心技术 [21] - 第二章包含大语言模型 BEV感知 扩散模型理论 强化学习与RLHF等关键技术栈 [18][27] - 扩散模型多模轨迹预测成为学术界和工业界追捧的热点 多家公司尝试落地 [33][34] 课程章节内容设计 - 第一章介绍端到端自动驾驶发展历史 技术范式演变及业界动态 [27] - 第二章重点讲解端到端涉及的背景知识 为后续章节奠定基础 [27] - 第三章聚焦二段式端到端 分析PLUTO CarPlanner和Plan-R1等经典与前沿工作 [28] - 第四章深入一段式端到端子领域 包括基于感知 世界模型 扩散模型和VLA的方法 [29] - 第五章设置RLHF微调大作业 提供预训练和强化学习模块的实战指导 [38] 实战项目安排 - 包含Diffusion Planner实战项目 适用于求职应用场景 [33] - 基于小米ORION的VLA实战 揭开自动驾驶VLA神秘面纱 [36] - RLHF微调作业具有良好延展性 可迁移到VLA相关算法中 [38] 技术人才市场需求 - VLA/VLM大模型算法专家薪资达40-70K-15薪 [19] - 多模态VLA大模型方向顶尖技术人才薪资达90-120K-16薪 [19] - VLM/VLA大模型算法工程师薪资35-65K [19] - VLM实习生日薪220-400元 [19] 课程特色与目标 - 基于Just-in-Time Learning理念 帮助学员快速掌握核心技术栈 [22] - 构建端到端自动驾驶研究框架 提升论文分类和创新点提取能力 [23] - 学完可达1年左右端到端自动驾驶算法工程师水平 [43] - 可复现扩散模型 VLA等主流算法框架 应用于实际项目 [46]
为什么多模态感知会是自驾不可或缺的方案...
自动驾驶之心· 2025-09-06 10:01
自动驾驶多模态感知融合技术演进 - 激光雷达提供超长感知距离的安全冗余、高帧率实时感知、恶劣环境抗干扰保障和三维空间认知能力,精准解决自动驾驶感知痛点 [1] - 多传感器融合构成可靠工作能力,高帧率确保动态捕捉实时性,高稠密点云提供细节支撑,三维感知构建全局认知 [1] - 多模态感知融合技术从传统融合方式向端到端融合和基于Transformer架构演进,成为国内高端智能驾驶量产主流范式 [1][2] 多模态融合技术架构发展 - 传统融合分为早期融合(输入端拼接原始数据,计算量巨大)、中期融合(传感器特征提取后融合,主流方案)和后融合(决策层结果融合,可解释性强但难以解决信息冲突) [2] - 基于Transformer的端到端融合通过跨模态注意力机制学习不同模态数据深层关系,实现高效鲁棒的特征交互,减少中间模块误差累积 [2] - BEV视角处理解决不同传感器数据空间对齐难题,并与下游任务无缝连接 [2][4] 多模态融合研究课程体系 - 课程系统覆盖多模态特征提取、端到端自动驾驶、传感器融合和视觉表征学习等关键技术领域 [5] - 招生对象为本硕博群体,每期限招6人(至多8人),需具备深度学习基础和多模态融合算法了解,并通过1v1面试筛选 [5][6] - 硬件要求最低2张4090显卡(推荐4张以上),需掌握Python、PyTorch和Linux开发调试能力 [7] 课程内容与产出 - 课程周期为12周在线科研+2周论文指导+10周论文维护期,提供经典论文、前沿论文和代码实现 [6][26] - 使用公开数据集包括nuScenes、KITTI和ADUULM-360,并提供多模态3D目标检测和BEVFormer等Baseline代码 [13][15] - 学员产出包括论文初稿、项目结业证书和推荐信(视表现而定),重点培养科研流程、写作方法和创新思路 [15][21] 技术应用与前沿方向 - 多模态融合应用于高精度地图构建、自动泊车和恶劣天气鲁棒驾驶等场景,显著提升自动驾驶系统安全性 [4][19] - 未来发展方向包括利用自监督学习和生成式模型弥补标注数据稀缺性,探索多任务学习和知识蒸馏优化模型效率 [19] - 三元融合技术聚焦毫米波雷达、视觉和激光雷达的深度结合,解决标定、同步与异构数据处理等挑战 [4][19]
无力支付1.5万劳动仲裁款!百度前高级副总裁王劲创业失败,已失联
每日经济新闻· 2025-09-06 07:30
公司破产清算事件 - 江苏省南京市栖霞区人民法院裁定受理对中智行的破产清算申请 因公司无力支付1.5万元劳动仲裁款进入"执转破"程序 [1][2] - 法院调查显示公司涉及多件执行不能案件 涉案金额巨大且资不抵债 经营场所不明且无法取得联系 [4] - 公司官网无法打开 公开电话为空号 北京/福州/深圳三家分公司均已注销 微信公众号自去年2月停止更新 [5] 公司财务状况 - 实缴注册资本达1.5亿元人民币 但历史被执行总金额达4732.8万元 [5][6] - 两起终本案件执行标的总金额2360.3万元 其中未履行金额2192.8万元 [6] - 2024年10月起多次成为被执行人 单笔最高执行标的达1341.6万元 [7] 管理层变动 - 2024年8月21日创始人王劲卸任法定代表人 由张水生接任 变更后公司多次被限制高消费 [7][8] - 工商信息显示公司参保人数为0人 人员规模为0人 [6] 创始人背景 - 公司由前百度高级副总裁/百度自动驾驶事业部首任总经理王劲于2018年创立 [1][9] - 王劲曾历任谷歌中国工程研究院副院长 eBay中国CTO 阿里巴巴集团技术最高负责人 [10] - 其创立的景驰科技后更名为文远知行 于2024年10月在纳斯达克上市 [10] 技术路线与行业环境 - 公司主攻L4级自动驾驶领域 采用车路协同技术路线 自称全球首个融合5G和AI的无人驾驶技术公司 [1][11] - 行业分析师指出自动驾驶投资热退潮 资本要求清晰盈利时间表 行业加速洗牌 [11] - 车路协同需路侧部署大量基础设施 基建投入大见效慢 商业模型不清晰 短期内难以走通 [12] 行业现状 - 目前行业主流技术路线为单车智能 依赖高精度传感器和算法 落地速度更快 [12] - 尚无自动驾驶公司实现盈利 文远知行2024年Q2净亏损4.06亿元 小马智行净亏损3.8亿元同比扩大72.5% [12] - 多家自动驾驶企业退场 包括破产清算的清研微视(估值曾超90亿元) 破产重整的纵目科技 退市的图森未来 [11]