Workflow
Autonomous Driving
icon
搜索文档
新势力提前批,跪了。。。
自动驾驶之心· 2025-08-06 11:25
自动驾驶行业研究 - 自动驾驶行业正处于快速发展阶段,涉及多个技术方向如BEV感知、VLA、端到端自动驾驶等[23][30][41] - 行业技术热点包括3DGS与NeRF场景重建、世界模型、视觉语言模型(VLM)等前沿领域[43][45][47] - 主流技术路线涵盖感知融合、规划控制、仿真测试等多个环节[23][30] 自动驾驶技术方向 - BEV感知已成为量产方案基石,包含纯视觉和多模态方案[54] - 端到端自动驾驶包含一段式、二段式及量产方案[41] - 3D目标检测技术路线包括激光点云、单目/双目及多模态方法[56] - 多传感器融合技术包含强融合、弱融合和后融合方案[58] 行业资源与生态 - 自动驾驶领域拥有近60+数据集,涵盖感知、预测、强化学习等方向[39] - 行业主流仿真平台包括Carla、Apollo、Autoware等[23][82] - 开源项目覆盖3D检测、BEV感知、大模型应用等40+方向[37] 企业布局与人才需求 - 头部企业包括蔚小理、地平线、华为、大疆等[23][33] - 企业面试注重候选人技术深度及非技术能力如沟通、学习能力等[4][5][6][7] - 行业建立内推机制,提供岗位对接服务[13][21] 技术发展趋势 - VLA(视觉语言动作)成为2025年重点方向[49] - 扩散模型应用于数据生成、场景重建等领域[52] - 在线高精地图是无图NOA方案核心[60] - 强化学习是VLM必备组件[63]
WeRide Launches 24/7 Robotaxi Testing in Beijing, Advances Towards Full-Day Service
Globenewswire· 2025-08-06 10:15
公司动态 - 公司获得北京高级别自动驾驶示范区批准,可在晚10点至早7点进行Robotaxi夜间公开道路测试 [1] - 此次夜间测试是公司在北京构建24/7自动驾驶出行网络的关键一步 [1] - 公司已在4个国家的10个城市开展Robotaxi测试或运营,累计拥有2200天公开道路安全经验 [5] - 2025年5月公司在广州推出中国首个一线城市24/7自动驾驶出行网络 [5] 技术能力 - 公司Robotaxi配备20多个传感器,包括高动态摄像头和高线数激光雷达 [3] - 采用专有多传感器融合算法和HPC高性能计算平台,实现200米范围内360度无盲区探测 [3] - 开发智能传感器清洁系统,可自动检测污垢和湿气并触发清洁 [4] - 系统能在低光照和恶劣天气下保持稳定感知和快速决策 [3][4] 市场地位 - 公司是全球自动驾驶行业领导者,也是首家上市的Robotaxi企业 [9] - 已在10个国家的30多个城市测试或运营自动驾驶车辆 [9] - 在6个市场(中国、法国、沙特、新加坡、阿联酋和美国)获得自动驾驶许可 [9] - 入选《财富》杂志2024年"未来50强"榜单 [9] 业务发展 - 公司通过WeRide One平台提供L2至L4级自动驾驶产品和服务 [9] - 服务覆盖出行、物流和环卫等多个行业 [9] - 北京24/7测试将验证公司技术和安全系统,同时填补夜间和凌晨公共交通空白 [6] - 未来将继续利用全栈自动驾驶技术和安全系统扩展出行服务 [7]
自动驾驶论文速递 | 扩散模型、轨迹预测、TopoLiDM、VLA等~
自动驾驶之心· 2025-08-05 03:09
基于可控扩散模型的生成式主动学习框架GALTraj - 提出GALTraj框架首次将可控扩散模型应用于轨迹预测的长尾问题通过尾样本感知生成技术动态增强稀有场景数据 [1] - 在WOMD和Argoverse2数据集上使长尾指标FPR₅相对降低47.6%(从0.42→0.22)整体预测误差minFDE₆降低14.7%(从0.654→0.558) [1] - 设计尾部感知生成方法对交通场景中的尾部代理、头部代理和相关代理分配差异化扩散引导生成兼具真实性、多样性且保留尾部特征的场景 [2] - 在多个骨干模型(QCNet、MTR)上验证显著提升尾部样本预测性能同时改善整体预测精度 [2] 拓扑感知激光雷达扩散模型TopoLiDM - 提出TopoLiDM框架通过拓扑正则化的图扩散模型实现高保真激光雷达生成 [13] - 在KITTI-360数据集上以22.6%的FRID下降率和9.2%的MMD下降率超越现有最优方法同时保持1.68样本/秒的实时生成速度 [13] - 采用紧凑的拓扑图作为潜在表示实现了快速、可解释且高保真的LiDAR点云生成 [15] - 拓扑感知VAE模块通过图构建和多层图卷积提取潜在图表示并引入0维持久同调约束确保生成的LiDAR场景符合真实世界环境的全局拓扑规则 [15] 高效端到端自动驾驶框架FastDriveVLA - 提出基于重建的视觉Token剪枝框架FastDriveVLA通过对抗性前景-背景重建策略在50%剪枝率下保持99.1%轨迹精度并降低碰撞率2.7% [21] - 设计ReconPruner通过MAE风格像素重建训练的即插即用修剪器增强识别有价值令牌的能力 [27] - 构建nuScenes-FG数据集包含241k图像-掩码对针对自动驾驶场景的前景分割标注 [27] - 在nuScenes开环规划基准上实现SOTA性能 [27] 语言大模型驱动自动驾驶框架PLA - 提出统一的感知-语言-动作(PLA)框架通过整合多传感器融合和GPT-4.1增强的视觉-语言-动作推理核心实现自适应自动驾驶 [34] - 在nuScenes数据集的城市交叉路口场景中速度预测的平均绝对误差(MAE)降至0.39 m/s、R²分数达0.923轨迹跟踪的平均位移误差(ADE)为1.013米 [34] - 多传感器语义融合模块整合激光雷达、雷达和相机数据生成结构化场景描述提升空间精度与语义丰富度 [38] - 通过LLM驱动的上下文推理增强对未见过场景的泛化能力实现鲁棒决策 [41] 自动驾驶行业资源整合 - 梳理近40+技术路线包括咨询行业应用、VLA benchmark、综述和学习入门路线 [50] - 整理国内高校著名自动驾驶团队和领域企业介绍 [52] - 汇总自动驾驶数据集与标定、仿真工具包括近百个数据集和标注工具 [52] - 提供基础入门资料涵盖数学基础、计算机视觉、深度学习和编程相关内容 [52]
自动驾驶秋招&社招求职群成立了!
自动驾驶之心· 2025-08-04 23:33
自动驾驶技术趋势 - 自动驾驶技术栈呈现趋同态势,从过去分散的几十个方向逐渐向统一方案演进 [1] - 当前技术发展重点集中在one model、VLM(视觉语言模型)、VLA(视觉语言行动模型)等统一架构 [1] - 技术方案统一化背后反映出行业技术壁垒的显著提升 [1] 行业社群发展 - 行业社群定位为综合型平台,旨在汇集自动驾驶全产业链人才 [1] - 社群主要功能包括产业动态讨论、公司分析、产品研发交流、求职与职业发展等内容 [1] - 社群运营目标是通过资源共享帮助从业者成长,并建立行业人脉网络 [1]
小马智行在上海浦东推出自动驾驶出行服务,可通过App或小程序呼叫
新浪科技· 2025-08-04 07:29
小马智行表示,运营时段充分满足市民包括早晚高峰在内的日常通勤及休闲出行需求,同时运营线路覆 盖浦东新区人民政府、啦啦宝都购物中心、世纪公园、浦东足球场地铁站等核心商圈、地标场所及热门 地铁站,有效连接区域内工作、生活、休闲三大场景,让自动驾驶技术真正服务于市民的日常出行需 求。 责任编辑:王翔 消息称,小马智行联合锦江出租率先在浦东金桥和花木地区推出了面向公众常态化运营的Robotaxi服 务。每周一至周五早7:30至晚9:30,市民通过"小马智行"手机App或小程序,均可呼叫Robotaxi作为 出行交通工具。运营线路覆盖浦东新区人民政府、啦啦宝都购物中心、世纪公园、浦东足球场地铁站等 核心商圈、地标场所及热门地铁站。 8月4日消息,小马智行宣布,8月1日起,小马智行在上海浦东推出了面向公众常态化运营的Robotaxi服 务。 ...
自动驾驶运动规划(motion planning)发展到了什么阶段?
自动驾驶之心· 2025-08-03 00:33
交互式规划技术框架 - 交互式规划本质上是一个世界模型 用于描述自车与周围环境的动态交互关系[4] - 交互建模的核心在于推理其他交通参与者的未来行为 涉及博弈论、POMDP和应变规划器等理论框架[5] - 典型方法包括基于预测模型的交互规划 通过扰动自车轨迹增强条件预测(EC) 并构建轨迹树进行动态规划优化[6] TPP(Tree-structured Policy Planning)方法 - 通过构建自车轨迹树 为每个分支生成预测场景树 最后通过动态规划获得最优策略[6] - 损失函数包含三个部分:预测损失L_prediction(预测结果与GT的误差)、EC碰撞损失L_EC_collision(预测结果与自车轨迹的碰撞)、碰撞损失L_collision(交通参与者之间的碰撞)[9] - 其中L_EC_collision强制要求预测的交通参与者不能与自车轨迹发生碰撞 体现了交互逻辑[9] IJP(Interactive Joint Planning)方法 - 采用基于同伦(homotopy)的轨迹采样方法 将障碍物视为电流 利用安培环路定律计算磁场线积分 大幅减少采样数量[13][15] - 通过模型预测控制(MPC)联合优化自车和其他交通参与者轨迹 线性约束条件考虑了自车与其他车辆之间的碰撞关系[16] - 计算延迟分析显示:预测部分耗时50ms(Nvidia 3090) SQP求解每条轨迹需300ms(构建150ms+求解150ms) 总延迟达1850ms[18] 实时性优化方案 - 采用ADMM(交替方向乘子法)替代SQP 将大规模优化问题分解为可组合的子问题 在16个交通参与者情况下可达125Hz频率[19] - 嵌入式在线MPC技术可实现兆赫兹级别的优化速率 满足实时性要求[19] DIPP(Differentiable Integrated Prediction and Planning)方法 - 采用可微分框架 联合学习预测模型和规划代价函数的权重参数[21][22] - 损失函数包含多模态预测损失L_prediction、评分损失L_score、模仿损失L_imitation和代价损失L_cost[31] - 使用Transformer编码器处理交通参与者历史和地图信息 通过可微非线性运动规划器进行优化[27][30] 技术挑战与局限性 - 预测导向方法存在反事实安全问题 如主动汇入场景中预测与实际行为可能不一致[41] - 静态场景(如道路施工)中预测导向方法效果有限 需要参数自动调整而非轨迹学习[44] - 真实标注数据存在不一致性问题 驾驶员行为有时让行有时主动 需要行为/轨迹聚类[41] 方法对比与应用前景 - TPP采用采样生成自车轨迹 预测模型参数可学习 代价权重人工设定[40] - IJP通过优化生成自车轨迹 预测模型参数固定 代价权重人工设定[40] - DIPP通过Transformer和优化器生成自车轨迹 预测模型参数和代价权重均可学习[40] - 模块化框架(IJP)性能明确但依赖预测模型质量 端到端框架(DIPP)性能不明确但值得探索[45] - 未来方向包括:Theseus库参数调优、联合优化解释性、Transformer交互建模可扩展性[45]
自动驾驶之心求职与行业交流群来啦~
自动驾驶之心· 2025-08-02 06:00
行业与求职现状 - 学校学习内容与实际工作需求存在显著差距 导致应届生在求职时缺乏竞争优势 [1] - 从业者存在转型需求 如转向大模型 世界模型或具身智能领域 但对行业实际动态了解不足 [1] 社群定位与功能 - 社群目标为搭建连接学校与企业的综合型平台 促进人才与产业对接 [1] - 核心讨论内容包括产业趋势 公司动态 产品研发及求职跳槽信息 [1] - 提供行业人脉拓展渠道 帮助成员获取第一手产业资讯 [1] 社群运营方式 - 通过微信扫码添加助理并备注"自驾+昵称+求职"完成入群申请 [1]
ACM MM'25 | 自驾2D目标检测新SOTA!超越最新YOLO Series~
自动驾驶之心· 2025-08-01 16:03
自动驾驶目标检测技术 - 当前主流架构如YOLO、DETR在追求轻量化和速度时牺牲了特征一致性与层次表达能力,难以兼顾小目标检测与复杂场景理解[2] - 频率混叠和融合过程僵化是现有Neck结构的主要问题,导致特征表达能力下降和检测器感知能力受限[9][10] - Butter框架通过解耦式设计实现精度与效率的统一,在Neck层引入频率一致性增强模块和渐进式层次特征融合网络[11] Butter框架核心技术 - 频率一致性增强模块(FAFCE)融合高频细节增强与低频噪声抑制,提升边界分辨率[3][20] - 渐进式层次特征融合网络(PHFFNet)逐层融合语义信息并引入空间感知机制,强化多尺度特征表达[3][29] - Backbone采用轻量化改进的HGNetV2,使用GhostConv、RepConv等模块减少参数量,提升推理效率[17] 性能表现 - 在KITTI数据集上mAP@50达到94.4%,比TOD-YOLOv7高出1.2个百分点,计算量仅为后者约1/3[32] - 在BDD100K和Cityscapes数据集上分别取得53.7%和53.2%的mAP@50,显著优于Hyper-YOLO-S方法[32] - 参数量比Hyper-YOLO-S减少约64%,显示更优的部署适应性[32] 技术细节 - FAFCE模块通过高频增强与低频抑制两种机制提升多尺度特征融合准确性[20] - PHFFNet采用从低层向高层的逐级融合策略,缓解非相邻层间语义差异[29] - 引入空间动态权重机制(CASF)动态分配不同空间位置的多层特征权重[31] 应用前景 - 方法具备良好的通用性与部署适配性,适用于主流SOTA检测器[15] - 具备轻量化潜力,可用于高性能自动驾驶视觉系统部署[15] - 在复杂道路场景中实现高精度目标检测与结构感知[14]
WeRide Inc.(WRD) - 2025 Q2 - Earnings Call Transcript
2025-07-31 13:02
财务数据和关键指标变化 - 第二季度总营收达1.272亿人民币,同比增长60.8%,主要受产品和服务业务强劲增长驱动 [20] - 产品收入同比增长309.6%至5980万人民币,其中Robotaxi收入达4590万人民币,同比增长836.7%,占集团收入比重达36.1% [21] - 服务收入同比增长4.3%至6740万人民币,主要受益于智能数据服务和L4运营支持增加3580万人民币 [22] - 集团层面毛利润增长40.6%至3570万人民币,毛利率28.1% [23] - 运营费用同比增长42.5%至4.878亿人民币,其中研发费用占比65.4%,同比增长33.1%至3.189亿人民币 [23][24] - 净亏损同比下降1.7%至4.064亿人民币,非国际财务报告准则下净亏损增至3.066亿人民币 [26] - 截至2025年6月30日,公司持有总资本储备58亿人民币,包括41亿人民币现金及现金等价物、定期存款以及17亿人民币理财产品 [26] 各条业务线数据和关键指标变化 - Robotaxi业务收入创历史新高,同比增长836.7%,占集团收入比重达36.1% [21] - 在中东地区运营最大Robotaxi车队,覆盖阿布扎比核心区域50% [12] - 与Uber合作车队规模在6个月内增长三倍 [12] - 在沙特阿拉伯利雅得推出首个Robotaxi试点 [14] - 在中国广州获得Robovan W5第二轮许可 [15] - 在新加坡圣淘沙推出东南亚首个全无人驾驶Robobus服务 [15] - 在巴黎与雷诺集团合作提供机器人班车服务 [15] 各个市场数据和关键指标变化 - 全球业务扩展至10个城市,新增迪拜、利雅得和上海 [10] - 中东地区是战略重点,2023年成为首家在阿联酋获得全国性许可的公司 [11] - 阿布扎比业务覆盖核心区域50%,包括主要高速公路和机场 [12] - 计划年底前将车队规模扩大至数百辆,并扩展至新区域 [12] - 在迪拜开始测试,预计今年晚些时候启动试点运营 [13] - 在上海与Cherry和锦江出租车合作,覆盖上海世博中心、浦东国际机场和上海迪士尼度假区等主要地标 [14][15] 公司战略和发展方向和行业竞争 - 采用"一个平台"策略,通过WeRide One平台支持多种城市移动应用 [31] - 多产品战略提供更大数据收集机会和供应链稳健性 [34] - 与Uber、雷诺集团等建立战略合作伙伴关系 [13][15] - 推出HPC 3.0计算平台,采用双NVIDIA Thor芯片,提供2000 TOPS AI计算能力,将自动驾驶套件成本降低50% [16][17] - 与Cherry合作推出下一代Robotaxi CER,具备五层冗余系统,已准备量产 [17][18] - 已在六个国家获得自动驾驶许可,累计完成1400万公里真实世界自动驾驶里程 [19] - 面对特斯拉等新进入者竞争,强调技术领先性和安全记录优势 [75][76] 管理层对经营环境和未来前景的评论 - 中东地区将持续作为2025年关键增长区域 [11] - 预计Robotaxi业务增长趋势将持续,成为主要收入贡献者 [36] - 目标在阿布扎比获得无人驾驶商业许可,并在其他市场复制类似进展 [53] - 计划在中国新增数百辆车辆,国际市场上千辆 [57] - 沙特阿拉伯交通总局公开承诺到2030年实现25%自动驾驶渗透率 [56] - 强调数据隐私和本地化,严格遵守当地数据治理要求 [96] 其他重要信息 - HPC 3.0计算平台已集成到GFR Robotaxi中,成为全球首款采用NVIDIA Thor芯片的量产L4车辆 [17] - 开发Genesis平台,用于训练和验证自动驾驶系统,支持生成各种天气和场景的模拟数据 [85] - 视觉语言模型(VLM)已集成到L4系统中 [83] - 在阿布扎比开始无人驾驶测试,为未来商业无人驾驶服务铺路 [12] - 公司创始人Tony Han被任命为新加坡自动驾驶指导委员会成员 [34] 问答环节所有的提问和回答 问题: 多产品战略及Robotaxi业务增长趋势 [29] - 多产品战略优势包括更大数据收集机会、供应链稳健性和市场适应性 [31][32][33] - Robotaxi收入贡献增长趋势将持续,预计保持主要收入来源地位 [36] - 增长驱动力包括车队扩张、三重增长引擎(硬件销售、服务收入、收入分成)和目标市场更高单位经济效益 [37][38] 问题: HPC 3.0平台部署及下一代Robotaxi设计 [43] - HPC 3.0已上路,采用双NVIDIA Thor芯片,提供2000 TOPS计算能力 [45][46] - 平台符合ISO 26262等功能安全标准,制造成本降低50% [48] - 下一代Robotaxi CER已准备量产,具备五层冗余系统 [17][18] 问题: 全球许可获取及车队扩张计划 [52] - 预计在阿布扎比将测试许可升级为商业许可 [53] - 目前全球车队规模超过1300辆,约三分之一在中国以外 [54] - 计划在中国新增数百辆,国际市场目标上千辆 [57] 问题: Robotaxi商业模式及HPC 3.0影响 [63] - 采用合作伙伴模式,专注自动驾驶技术,合作伙伴提供运营专长 [66][67] - HPC 3.0将推动规模化部署,改善单位经济效益 [16][17] 问题: 全球市场扩张挑战 [89] - 挑战包括当地气候条件适应、法规差异和数据本地化要求 [90][92] - 通过Genesis平台和本地数据收集解决技术适应问题 [91] - 早期进入者优势可帮助塑造监管框架 [93] 问题: 技术竞争优势 [98] - 同时开发L4自动驾驶和ADAS系统,技术基础广泛 [100][101] - 视觉语言模型和生成式AI技术集成 [83][85] - 强调安全记录和实际运营经验 [76] 问题: 中东市场竞争格局 [107] - 在中东运营最大商业Robotaxi车队 [109] - 标准化部署手册和本地化能力是关键优势 [110] - 已克服极端环境等本地挑战 [111][112]
WeRide Accelerates Global Growth, Robotaxi Revenue Grew 836.7%
GlobeNewswire News Room· 2025-07-31 08:00
NEW YORK, July 31, 2025 (GLOBE NEWSWIRE) -- WeRide Inc. ("WeRide" or the "Company") (Nasdaq: WRD), a global leader in autonomous driving technology, today announced its unaudited financial results for the three months ended June 30, 2025. Recent Highlights Redefining Autonomous Driving with Leading Technology Breakthroughs High-Performance Computing (HPC) 3.0 Platform Powered by NVIDIA DRIVE AGX Thor Chips Partnership with Chery on New-Generation Robotaxi to Revolutionize Urban Mobility Unparalleled Robotax ...