Workflow
Autonomous Driving
icon
搜索文档
坐萝卜 逛佛山:顺德联合萝卜快跑打造“自动驾驶+特色文旅”新体验
新华网· 2025-08-29 04:59
活动概况 - 8月26日顺德区举办自动驾驶美食文旅融合活动 主题为"智载新城·乐游顺德" 标志着"美食+自动驾驶出行"文旅创新模式正式落地 [1] - 活动由佛山市及顺德区相关领导与萝卜快跑企业代表共同发布"萝卜快跑美食文旅地图乐从版" 并开通"顺德美食文旅自动驾驶专线" [1] - 自动驾驶专线全程7.2公里 串联国潮运动公园 世纪莲体育中心 新城滨河景观公园 罗浮宫国际家具博览中心等二十余个文旅地标 [1] 战略意义 - 活动是推动智慧城市建设与促进文旅产业高质量发展的创新实践 实现科技与文旅深度融合 [1] - 乐从镇镇长指出智慧车穿梭街巷是出行方式变革 让文旅活力与区域经济同频共振的全新路径 [1] - 构建"智能出行+文旅"生态的关键一步 萝卜快跑已实现佛山新城核心区域全覆盖 [2] 用户体验与反馈 - 市民评价自动驾驶让游览美食景点更便捷 既新颖有趣又能让孩子感受科技魅力 [2] - "坐萝卜 逛家具 品美食 看演出"的智慧文旅正逐渐成为市民和游客出行新选择 [2] 企业战略布局 - 百度自动驾驶选择佛山新城作为首发站 看中其作为佛山"城市客厅"的丰富资源与优越区位 [2] - 萝卜快跑将持续优化运营与服务体验 进一步融入佛山文旅生态布局 [2] - 公司将拓展三大应用场景:打造"移动美食文旅博物馆" 推出"自动驾驶夜游专线" 推动与地铁公交无缝接驳 [2] 未来规划 - 萝卜快跑将以科技赋能文旅 助力佛山构建"智能 便捷 有趣"的智慧文旅服务体系 [3] - 让"坐萝卜 逛佛山"成为独特文旅名片和文化景观 提供更丰富深度智慧的文旅新体验 [3]
ICCV'25港科大“先推理,后预测”:引入奖励驱动的意图推理,让轨迹预测告别黑箱!
自动驾驶之心· 2025-08-29 03:08
核心观点 - 引入"先推理,后预测"策略,通过奖励驱动的意图推理器提升轨迹预测的可解释性和可靠性 [5][8][10] - 提出FiM模型,在Argoverse和nuScenes基准测试中实现极具竞争力的性能,部分指标超越最先进模型 [10][33][36] - 结合强化学习范式(MaxEnt IRL)和结构化解码器(Bi-Mamba),显著提高预测准确性和置信度 [8][9][10] 方法框架 - 采用编码器-解码器结构,包含以查询为中心的场景编码器、Mamba增强的解码器和奖励驱动的意图推理器 [14][16] - 通过QIRL框架将MaxEnt IRL与矢量化上下文结合,学习奖励分布并生成意图序列(GRT) [8][18] - 使用辅助的时空占用网格地图(OGM)预测头建模未来交互,增强特征融合 [9][18] - 分层DETR类解码器生成轨迹提议,并通过Bi-Mamba结构捕获序列依赖关系 [9][19][21] 实验性能 - 在Argoverse 1测试集上,FiM的MR6为0.1087,minFDE6为1.1199,Brier分数为0.5732,部分指标领先HiVT、Scene Transformer等模型 [32][33] - 在Argoverse 2验证集上,FiM变体的minFDE6为0.528–0.530,优于DeMo(0.543)和QCNet(0.551) [34][35] - 在nuScenes数据集上,FiM的minADE10为0.78,MR10为0.23,显著超越P2T、THOMAS等模型 [36] 技术贡献 - QIRL模块有效替代交叉注意力机制,在消融实验中brier-minFDE6从2.132降至1.602 [37][38] - OGM和细化模块分别将brier-minFDE6从1.670和1.801优化至1.602 [40] - Bi-Mamba结构相比单向Mamba降低brier-minFDE6从1.636至1.602,验证双向扫描机制优势 [41][42] - 最优Mamba层深度为6层,更深层可能导致性能下降 [43]
地平线_2025 年下半年超级驾驶(SuperDrive)和 J6P 大规模量产,推动产品结构升级;2025 年上半年收入同比增长 68%,但营业利润不及预期;买入评级
2025-08-29 02:19
公司:地平线(Horizon Robotics, 9660 HK) 核心财务表现 * 公司1H25收入优于预期 同比增长68% 环比增长8% 达到16亿人民币 比高盛预估和彭博共识分别高出6%和9%[1][3] * 1H25毛利率为65.4% 2Q25毛利率为65.1%[3][7] * 1H25营业亏损为18.55亿人民币 高于预期 主因算法训练的云服务费用增加导致运营开支超预期 达到14亿人民币[1][3] * 1H25净亏损为52.33亿人民币 远高于高盛预估的13.59亿亏损 主因一项可转换贷款的公允价值变动产生非营业亏损[3][7] * 高盛将公司2025E/2026E净亏损预测下调至88亿人民币/32亿人民币(原预测为27亿/3.56亿)以反映该非营业亏损[7] 产品与业务进展 * 公司Journey 6产品出货量爬坡推动收入增长及平均售价(ASP)提升[1][3] * 1H25具备高速导航辅助驾驶(highway NOA)功能的产品出货量达98万台 占总出货量的50% 推动混合ASP提升[1] * 公司计划于2H25E在奇瑞星纪元(Chery Xingjiyuan)车型上开始量产HSD(Horizon SuperDrive)解决方案 该方案由J6P大算力平台(560 TOPS)驱动 可实现城市导航辅助驾驶(urban NOA)功能[1][2] * 管理层预计HSD和J6P平台将在2026年放量 并对J6P带来的更高ASP和单車价值提升持乐观态度[2] * 高盛看好公司的软硬件集成解决方案能提升单車价值含量 并为客户提供满足上市时间需求的一站式解决方案[2] 财务预测与估值 * 高盛基于2029E EV/EBITDA倍数26.0x(基于同行EBITDA增长与交易倍数的相关性得出)并采用11.5%的股权成本(COE)折现回2026E 将12个月目标价上调至14.00港元(原为13.13港元)[8][14] * 高盛维持对公司的买入(Buy)评级 当前股价7.94港元对应76.3%的上涨空间[16] * 高盛小幅上调2027E-2030E净收入预测各1% 主要基于J6P大算力平台收入更高以及向更多车型加速渗透的预期[7] * 由于股本数量更新 高盛将2027E-2030E的每股收益(EPS)预测上调各10%[7] 风险因素 * 面临的主要下行风险包括:竞争比预期更激烈或汽车供应链在需求疲软下面临定价压力 向高级别自动驾驶(AD)的产品组合升级慢于预期 客户群扩张慢于预期 以及地缘政治紧张局势带来的供应链风险[15] 其他重要信息 * 高盛在過去12个月内曾为地平线提供投资银行服务并收取报酬 并预期在未来3个月内寻求此类报酬[25] * 报告包含法规要求的披露信息 指出高盛可能与本报告所涉公司存在业务关系从而产生利益冲突[5][25]
自动驾驶接驳、一键导航找座,“黑科技”全方位护航十五运会
21世纪经济报道· 2025-08-28 03:47
赛事科技应用 - 香港科技大学霍英东研究院开发微纳米级制冷技术 可将建筑表面温度降低15摄氏度[2] - 室内定位导航技术已在广东省奥林匹克体育中心 天河体育中心和广州体育馆完成铺设 支持观众通过小程序导航至座位[2] - 小马智行L4级自动驾驶技术将用于全运会期间运动员与观众接驳场景[2] - 视源电子智能机器狗具备体育场馆自动巡检功能[2] - 中科开创空中移动充电机器人支持大型赛事绿色出行与补能设施快速部署[2] - 广东中科凯泽智慧体育系统通过AI捕捉运动姿态生成十五运会专属精彩瞬间海报[2] 健康科技产品 - 视鹏科技推出基于外骨骼技术的智能助行与腰部保护装备 支持运动员康复训练[3] - 广东省新黄埔中医药联合创新研究院展示舌诊拍照设备 可生成体质报告[3] - 茶饮调配机可根据体质推荐配方[3] - 超声波药浴桶和音乐助眠沙发将分设于场馆周边和住宿区域[3] 相关ETF产品表现 - 食品饮料ETF(515170)近五日上涨0.84% 市盈率20.80倍 份额增加1.4亿份至66.5亿份 主力资金净流出8078.5万元 估值分位21.00%[5] - 游戏ETF(159869)近五日上涨8.05% 市盈率48.19倍 份额增加6100万份至53.5亿份 主力资金净流出8143.6万元 估值分位70.76%[5] - 科创半导体ETF(588170)近五日上涨4.52% 份额增加1200万份至3.8亿份 主力资金净流出1092.1万元[5] - 云计算50ETF(516630)近五日上涨7.94% 市盈率128.95倍 份额增加700万份至4.0亿份 主力资金净流入174.9万元 估值分位92.40%[6][7]
端到端全新范式!复旦VeteranAD:"感知即规划"刷新开闭环SOTA,超越DiffusionDrive~
自动驾驶之心· 2025-08-21 23:34
核心观点 - 提出"感知融入规划"新范式 将感知过程直接嵌入规划中 实现更全面和针对性的感知[5] - 设计VeteranAD框架 通过多模态锚定轨迹作为规划先验 引导感知模块预测关键交通元素[5] - 采用自回归策略逐步生成未来轨迹 每个时间步都结合针对性感知结果进行优化[5] - 在NAVSIM和Bench2Drive数据集上达到最先进性能 NAVSIM的PDM Score达到90.2[12][21] 技术架构 - 规划感知整体感知模块:在图像特征、BEV特征和交通体特征三个维度进行交互 实现对车辆、车道和障碍物的全面理解[6] - 局部自回归轨迹规划模块:以自回归方式解码未来轨迹 逐步调整锚定轨迹并结合感知结果优化[6] - 使用多模态轨迹查询 由锚定轨迹初始化 锚定轨迹从真实规划轨迹中聚类得到[14] - 采用位置引导的图像交叉注意力、BEV交叉注意力和交通体交叉注意力机制[15] 性能表现 - NAVSIM数据集:PDM Score达到90.2 显著优于UniAD的83.4和DiffusionDrive的88.1[21] - Bench2Drive开环评测:平均L2误差为0.60 优于所有基线方法[24] - Bench2Drive闭环评测:驾驶分数64.22 成功率33.85% 与DriveTransformer性能相当[25] - nuScenes数据集:平均L2位移误差降低0.10米 碰撞率减少27.2%[31] 方法优势 - 自回归解码相比非自回归方法性能更优 PDMS从88.6提升到90.2[30] - 三种注意力机制结合效果最佳 移除BEV注意力影响最大 PDMS下降1.1[28] - 训练时间约8小时 推理延迟22.3毫秒 与DiffusionDrive效率相当但性能更优[33] - 在复杂场景如车辆并入道路时能有效减速避让 避免碰撞[36] 行业背景 - 端到端自动驾驶将感知、预测和规划统一到框架中 避免多阶段信息损失[8] - 主流方法采用"感知-规划"顺序范式 而VeteranAD创新性地采用"感知融入规划"范式[3][5] - 早期基于规则的方法存在误差传播和有限场景覆盖问题 端到端方法逐渐取代模块化设计[8] - 闭环评估模拟完整反馈回路 开环评估在离线数据集测试轨迹预测[9]
WeRide Unveils WePilot AiDrive, A One-Stage End-to-End ADAS Targeted for Mass Production in 2025
Globenewswire· 2025-08-21 09:00
产品发布与技术创新 - 公司推出WePilot AiDrive单阶段端到端ADAS解决方案 与博世合作开发 距离双方两阶段方案量产仅隔6个月 [1] - 新方案将感知与决策集成至单阶段架构 实现同步"观察与行动" 类比人类驾驶员 带来更快响应速度 更短行驶路线及更高容错率 [2] - 系统已完成核心功能验证 预计2025年内实现量产与车辆部署 推动全球辅助驾驶解决方案向更智能 高效及普及化发展 [3] 技术架构与性能优势 - 单阶段端到端架构具备三大核心优势:可扩展算力平台支持高性能到中低功耗配置 通过模型蒸馏实现快速降级 专用中间件实现算法与硬件解耦 [4] - 支持纯视觉与多传感器融合方案 适应不同传感器配置 通过海量驾驶数据自动生成训练标签 实现低成本持续性能迭代 系统具备"越用越智能"特性 [4] - 模块化L2功能简化部署流程 加速系统集成与量产进程 专有中间件设计实现跨平台无缝适配 [4] 应用场景与功能表现 - 系统可处理复杂城市道路场景 包括拥堵路段变道 绕行突发施工 无保护路口转弯 跟车平稳加速等 [4] - 具备应对城中村窄路场景能力 可处理行人 对向车辆及路边障碍物的复杂交互 展现类人化L2自动驾驶与高强度安全性能 [4][5] - 方案覆盖从L2到L4级自动驾驶产品与服务 应用于出行 物流及环卫行业 测试运营范围遍及10国30余城 获六国自动驾驶许可 [6] 公司行业地位 - 公司为全球自动驾驶行业领导者及先行者 首家上市Robotaxi企业 入选《财富》杂志2024年"未来50强"榜单 [6] - 技术平台具备智能化 多功能 高性价比及强适应性特点 产品矩阵覆盖多行业交通需求 [6]
VisionTrap: VLM+LLM教会模型利用视觉特征更好实现轨迹预测
自动驾驶之心· 2025-08-20 23:33
文章核心观点 - 提出VisionTrap方法 通过引入环视摄像头视觉输入和文本描述监督 显著提升轨迹预测精度 同时保持53毫秒低延迟实现实时处理 [3][4][5] - 创建nuScenes文本数据集 利用VLM和LLM生成精细化文本标注 为每个场景中的每个智能体提供丰富的行为描述 [6][37][40] - 视觉语义编码器与文本驱动引导模块结合 使模型能捕捉人类凝视、手势、转向信号等关键视觉线索 较基线模型提升预测精度20%以上 [5][17][46] 技术方法创新 - 视觉语义编码器采用BEV特征与可变形注意力机制 将环境信息注入智能体特征 计算效率较全局注意力提升显著 [14][16] - 文本驱动模块通过多模态对比学习 使同一智能体的视觉与文本特征在嵌入空间中对齐 正负样本相似度阈值设为0.8 [19][21][24] - 轨迹解码器引入变换模块学习旋转不变性 输出采用高斯混合模型建模 损失函数包含轨迹负对数似然与InfoNCE对比损失 [26][32][36] 实验验证结果 - 在nuScenes数据集上测试 完整模型达到ADE10指标0.368 较仅使用地图编码器的基线模型提升9.6% [46][47] - 视觉输入使预测误差降低27.56% 文本引导模块进一步将误报率(MR10)从0.36降至0.32 [46] - UMAP可视化显示引入文本语义后 相似行为智能体的特征嵌入呈现明显聚类效应 [48][49] 数据集构建 - 微调VLM生成初始标注后经GPT细化 消除冗余信息并增强动作描述准确性 流程涉及边界框拼接与提示词优化 [37][42] - 数据集包含动态文本描述 能随智能体行为变化实时更新 如"行人停止交谈并开始过马路"等场景化表述 [40][51] - 相较DRAMA数据集单智能体单标题的局限性 新数据集提供多智能体多维度描述 更适配预测任务需求 [37]
VLM还是VLA?从现有工作看自动驾驶多模态大模型的发展趋势~
自动驾驶之心· 2025-08-20 23:33
基于LLM的自动驾驶决策方法 - 利用大语言模型的推理能力描述自动驾驶场景,处于自动驾驶与大模型结合的早期阶段 [4] - Distilling Multi-modal Large Language Models for Autonomous Driving 论文发表于arXiv [4] - LearningFlow 提出自动化策略学习工作流用于城市驾驶场景 [4] - CoT-Drive 使用思维链提示技术实现高效运动预测 [4] - PADriver 探索个性化自动驾驶解决方案 [4] - LanguageMPC 将大语言模型作为自动驾驶决策者 [6] - Driving with LLMs 融合对象级矢量模态实现可解释自动驾驶 [5] - A Language Agent for Autonomous Driving 项目主页位于USC-GVL实验室 [7] 基于VLM的自动驾驶决策方法 - 视觉语言模型成为当前主流范式,视觉是自动驾驶最依赖的传感器类型 [8] - Drive-R1 通过强化学习桥接VLM中的推理与规划能力 [8] - FutureSightDrive 使用时空调维思维链实现轨迹规划可视化 [8] - Generative Planning 利用3D视觉语言预训练进行端到端自动驾驶 [9] - ORION 通过视觉语言指令生成实现整体端到端自动驾驶框架 [12] - DriveVLM 实现自动驾驶与大视觉语言模型的融合 [12] - DriveGPT4 通过大语言模型实现可解释的端到端自动驾驶 [12] - LightEMMA 是轻量级端到端多模态自动驾驶模型 [12] 基于VLA的自动驾驶决策方法 - AutoVLA 结合自适应推理和强化微调的视觉-语言-动作模型 [17] - DiffVLA 使用视觉语言引导扩散规划进行自动驾驶 [18] - Impromptu VLA 提供开放权重和开放数据的驾驶视觉-语言-动作模型 [20] - DriveMoE 为端到端自动驾驶设计专家混合模型 [21] - OpenDriveVLA 致力于基于大视觉语言动作模型的端到端自动驾驶 [21] - AlphaDrive 通过强化学习和推理释放VLM在自动驾驶中的潜力 [17] - X-Driver 使用视觉语言模型实现可解释自动驾驶 [17] 研究机构与会议分布 - 多数研究以arXiv预印本形式发布,部分发表于ICLR 2024、ECCV 2024、NeurIPS 2024等顶级会议 [7][13][15] - 项目代码多开源在GitHub平台,包括PJLab-ADG、wayveai、USC-GVL等实验室仓库 [7][13][18] - 研究机构包括密歇根交通实验室、清华大学Mars实验室、上海交通大学ThinkLab等知名院校 [12][15][21]
红色沃土新答卷丨晋察冀抗日根据地·山西阳泉:数字赋能 “煤城”转型“数智新城”
央视网· 2025-08-20 03:49
阳泉市数智化转型 - 阳泉市从传统煤城转型为创新高地,实现数智化蝶变 [1] - 建成12座智能化矿井,煤炭先进产能占比达95.84% [3] - 5G智能化矿井实现井下人员减少50%,效率提升50% [3] 自动驾驶与智慧交通 - 阳泉成为全国首个全域开放自动驾驶的地级市 [5] - 建成"车城网"系统,实现车路协同 [5] - 大连街路口改造后车均延误率降低45%,停车次数减少70% [5] 数字经济发展 - 实施数字经济优先发展战略 [7] - 建成中电数字经济产业园、"晋创谷·阳泉"等平台 [7] - 2024年数字经济核心产业营收增长13.3% [7] - 获评"2023-2024年度中国新型智慧百强城市" [7]
自动驾驶一周论文精选!端到端、VLA、感知、决策等~
自动驾驶之心· 2025-08-20 03:28
自动驾驶技术研究进展 核心观点 - 近期自动驾驶领域涌现大量创新研究成果 涉及端到端驾驶 感知 VLM Benchmark等多个方向 [2] - 自动驾驶之心知识星球已构建产业 学术 求职 问答的闭环生态 提供40+技术路线梳理和数十位行业专家资源 [4] 端到端自动驾驶 - 中科大GMF-Drive提出门控Mamba融合与空间感知BEV表征的端到端方案 [8] - 清华与比亚迪合作开发ME³-BEV框架 结合Mamba架构增强BEV感知的深度强化学习 [8] - 博世联合清华等提出IRL-VLA方案 通过免仿真器强化学习训练VLA驾驶模型 获CVPR亚军 [8] 感知与VLM技术 - VISTA模型实现基于视觉语言模型的驾驶员注意力时空预测及自然语言解释 [7] - 清华团队开发VLM-3D框架 实现开放世界端到端视觉语言模型驱动的3D感知 [10] - 慕尼黑工业大学Dream-to-Recon方案利用扩散-深度蒸馏实现单目图像三维重建 [10] 决策规控领域 - 安全关键型自动驾驶BEV感知技术获系统性综述 [10] - 清华CBDES MoE架构首创模块级动态路由 实现功能解耦专家混合 [10] - 加拿大温莎大学RMT-PPAD模型通过Transformer实现实时多任务全景感知 [10] 仿真测试与数据集 - 北大ReconDreamer-RL框架结合扩散场景重建增强强化学习 [11] - STRIDE-QA数据集提供城市驾驶场景时空推理的大规模视觉问答资源 [12]