Autonomous Driving

搜索文档
数据闭环的核心 - 静态元素自动标注方案分享(车道线及静态障碍物)
自动驾驶之心· 2025-06-26 13:33
4D自动标注技术发展 - 轻图算法量产已成为行业共识 公司通过标注数据训练云端模型 再反哺车端模型迭代 实现全场景静态元素标注[1] - 传统2D图像标注需逐帧标注 效率低下 3D场景重建技术可实现静态元素单次标注 显著提升效率[2][3] - 行业采用BEV视图转换技术 通过自车位姿滑动窗口截取局部地面重建图 优化云端自动标注模型训练流程[6] 技术难点与解决方案 - 4D自动标注面临时空一致性要求高 多模态数据融合复杂 动态场景泛化难度大等五大核心挑战[7] - 静态元素标注需结合SLAM重建输出 获取全局道路信息 避免单帧感知导致的道路偏差问题[14] - 通用障碍物OCC标注成为行业标配 需解决点云稠密化 噪声优化 跨传感器遮挡等工程难题[15] 技术应用与课程体系 - 端到端真值生成整合动态障碍物 静态元素 可行驶区域等模块 采用一段式和两段式实现方案[16] - 数据闭环专题涵盖scaling law验证 主流公司架构分析 跨系统问题解决等实战经验[18] - 课程体系覆盖动态障碍物检测跟踪 SLAM重建原理 OCC标注全流程等六大核心模块[8][11][12][15][16] 行业人才需求 - 课程目标群体包括高校研究人员 企业技术骨干 转行人员等 需具备深度学习和PyTorch基础[22][24] - 课程培养方向聚焦4D标注算法研发能力 实际问题解决能力 工作竞争力提升三大维度[23]
自动驾驶之『多模态大模型』交流群成立了!
自动驾驶之心· 2025-06-26 12:56
自动驾驶技术平台 - 自动驾驶之心是国内领先的自动驾驶技术交流平台 [1] - 平台关注自动驾驶前沿技术、行业动态及职场成长 [1] - 平台覆盖具身智能、视觉大语言模型、世界模型等前沿技术方向 [1] - 涉及端到端自动驾驶、扩散模型、车道线检测等核心技术 [1] - 包含2D/3D目标跟踪、检测、BEV感知等多模态感知技术 [1] - 涵盖多传感器融合、transformer、大模型等AI技术 [1] - 涉及点云处理、在线地图、SLAM等空间感知技术 [1] - 包含光流估计、深度估计、轨迹预测等环境理解技术 [1] - 覆盖高精地图、NeRF、Gaussian Splatting等建模技术 [1] - 涉及规划控制、模型部署落地等应用技术 [1] - 包含自动驾驶仿真测试、产品经理、硬件配置等产业环节 [1] - 提供AI求职交流等职业发展支持 [1]
易控智驾冲刺港交所:全球最大矿区无人驾驶解决方案提供商,年营收近10亿
IPO早知道· 2025-06-26 00:39
公司概况 - 易控智驾成立于2018年,已成为实现大规模商业应用的L4级无人驾驶解决方案公司,尤其在矿区运输领域拥有显著先发优势 [2] - 公司拥有两大解决方案:矿区无人驾驶解决方案「著山」和智能矿区数字化解决方案「暮野」,分别针对无人驾驶运输和传统采矿设备升级 [2] - 按2024年收入计算,公司在全球所有L4级无人驾驶公司中排名第一 [3] 市场地位与运营数据 - 截至2025年6月18日,公司已部署超1,400辆活跃无人驾驶矿卡,是全球首家且唯一一家实现1,000+台活跃无人驾驶矿卡的公司 [3][4] - 公司拥有11家终端客户集团,技术已部署在24个矿场,包括国家能源集团、国家电投、紫金矿业等知名企业 [4] - 2022至2024年,公司在终端客户集团中保持100%留存率,平均首年车辆扩展率为457% [4] 财务表现 - 2022至2024年营收分别为0.60亿元、2.71亿元和9.86亿元,复合年增长率为305.8% [4] - 2024年毛利率转正至7.6%,净亏损率为39.5% [5] 融资与IPO计划 - 公司已获得兴杭国投、辰韬资本、紫金矿业、宁德时代等多家机构投资 [5] - IPO募集资金将主要用于加强软硬件研发、信息技术开发、全球业务扩张、人才发展及战略投资 [5]
登陆纳斯达克仅7个月,小马智行入选金龙指数
南方都市报· 2025-06-25 15:17
成分股调整与市场影响 - 小马智行首次入选纳斯达克中国金龙指数 成为指数中唯一代表L4级自动驾驶的前沿科技公司 [2] - 此次调整后指数共纳入73家中国企业 涵盖电商、新能源车、互联网等领域头部企业 [2] - 市场预计纳入将带来数亿美元量级被动资金配置 显著提升流动性与估值中枢 [2] - 公司从IPO到纳入核心指数仅用7个月 刷新中概股时间纪录 [2] - 消息公布当日纳斯达克中国金龙指数大涨3.3% 公司股价飙升16%领涨成分股 [4] 技术降本与商业化进展 - 第七代自动驾驶系统通过100%车规级设计 硬件成本较前代下降70% 其中计算单元降80% 激光雷达降68% [3] - 与丰田、北汽、广汽合作开发量产车型 计划2025年下半年在一线城市投放千台车队 [3] - 2024年Robotaxi业务收入同比激增200% 注册用户环比增长超20% [3] - 公司预计车队规模突破千台时将实现运营成本与收入动态平衡 [3] 全球化战略布局 - 与迪拜道路交通管理局达成战略合作 分阶段推进全无人Robotaxi商业化运营 并与当地轨道交通接驳 [7] - 已在韩国首尔、卢森堡启动路测 与新加坡康福德高联合开发出行服务 [7] - 获阿布扎比投资局、沙特新未来城基金等中东主权财富基金注资 [7] 行业趋势与定位 - 市场投资逻辑从"模式创新"转向"硬科技驱动" 自动驾驶赛道获资本认可 [4] - 公司形成"技术-资本-市场"三角闭环 推动自动驾驶规模化落地 [5]
Pony AI: The Next $1 Trillion Robotaxi Play?
The Motley Fool· 2025-06-25 10:00
公司发展 - 公司正在引领完全自动驾驶出租车(robotaxi)的部署竞赛 [1] - 近期技术进步可能推动股价创新高 [1] - 公司与优步、腾讯和丰田建立合作伙伴关系 [1] 市场前景 - 分析师对公司持乐观态度 [1] - 公司被视为1万亿美元规模的行业颠覆者 [1] 股价信息 - 2025年6月16日公司股价为16.73美元 [1][2] - 相关信息发布于2025年6月23日 [2]
Pony.ai Added to Nasdaq Golden Dragon China Index, Shares Surge 16.7%
Prnewswire· 2025-06-25 09:29
指数调整 - 小马智行(Pony.ai)被纳入纳斯达克金龙中国指数 成为该指数中唯一专注于自动驾驶技术的成分股 [1] - 调整于2025年6月23日生效 当前指数包含73家成分股 筛选标准基于市值和流动性 [2] - 指数覆盖科技(如阿里巴巴、网易)、消费服务(如京东、亚朵生活)、电动车(如蔚来、小鹏)等多个行业 [2] 指数背景 - 纳斯达克金龙中国指数成立于2003年 追踪在美国主要交易所上市的中国公司表现 是国际投资者参与中国经济的重要指标 [3] 公司表态 - 小马智行CFO表示此次纳入标志着公司2024年11月上市后的重要里程碑 有助于扩大投资者基础并提升全球知名度 [4] - 公司认为指数纳入将加速其自动驾驶技术在全球范围内的商业化进程 [4] 业务进展 - 公司运营约300辆Robotaxi 覆盖北京、上海、广州、深圳四大城市 可应对复杂交通场景和恶劣天气 [4] - 2025年4月发布第七代自动驾驶系统 全球首个采用100%车规级零部件 物料成本降低70% [5] - 计划2025年下半年与丰田、广汽、北汽联合量产第七代Robotaxi 年底前将车队规模扩大至1000辆 [5] 市场反应 - 6月24日公司股价上涨16.7%至13.3美元 同期纳斯达克金龙中国指数上涨3.3% 创逾一个月最大涨幅 [6]
小马智行纳入纳斯达克中国金龙指数
快讯· 2025-06-25 08:19
纳斯达克中国金龙指数成分股调整 - 小马智行被正式纳入纳斯达克中国金龙指数 [1] - 金龙指数是中概股投资标的风向标 [1] 小马智行资本市场影响 - 纳入指数意味着公司进入主流投资视野 [1] - 将吸引ETF基金、对冲基金、长线投资者的投资 [1] - 公司股票流动性和资本市场地位将进一步提升 [1] 行业意义 - 以小马智行为代表的中国自动驾驶科技获得资本市场认可 [1]
基于LSD的4D点云底图生成 - 4D标注之点云建图~
自动驾驶之心· 2025-06-24 12:41
4D标注技术 - 4D标注指三维空间+时间维度,能映射到任意时刻生成单帧真值用于模型训练,相比传统单帧标注可降低标注成本并提高数据质量[3] - 专注于小区域静态和动态元素标注,需支持"单趟建图"、"多趟建图"和"重定位"等关键技术[3] - 需适配有GNSS的行车场景和无GNSS的泊车场景[3] LSD框架 - 开源算法框架LSD整合数据采集、传感器标定、SLAM建图定位和障碍物检测功能,支持激光雷达4D点云底图生成[3][4] - 采用FASTLIO作为前端激光里程计,后端基于G2O融合GNSS观测和回环检测实现位姿图优化[7] 单趟建图技术 - 通过单次采集数据构建时空连续的高精度点云底图,适用于高速高架场景标注[5] - 采用FASTLIO前端里程计,后端融合GNSS观测和回环检测,优化GNSS异常点处理[7] - 处理GNSS异常点的两种策略:延迟使用(GNSS状态保持FIX 10秒才启用)和DCS鲁棒核函数(动态调整GNSS权重)[8][9][12] 雷达里程计退化处理 - 基于LOAM和X-ICP方法实现退化检测,通过特征贡献度分析识别退化方向[15] - 在隧道等退化场景中融合轮速传感器观测,提升纵向定位精度[17][18][19] GNSS杆臂误差校正 - 杆臂误差导致车辆转弯时点云重影,LSD将杆臂作为三维变量在PGO中估计[21][25][26] - 添加(0,0,0)先验约束解决不可观测性问题,优化后消除60cm错位[27][28][30] 回环检测与地图管理 - 通过GICP匹配实现地下停车场回环检测,减少里程计累积误差[31][32] - 采用ivox结构替代ikd-tree管理局部地图,通过LRU缓存和行驶距离约束避免重影[34][37] 多趟建图与地图合并 - 行车场景通过坐标系统一和GICP匹配优化合并多趟地图[40] - 泊车场景采用ScanContext+PCM算法估计坐标系变换矩阵实现无GNSS地图合并[42] 重定位应用 - 在标注真值底图上实现重定位以持续获取新数据标注,降低边际成本[44] - 采用固定真值地图关键帧节点的优化方案[44] 行业技术趋势 - 数据驱动算法推动4D标注需求增长,LSD框架提供开源解决方案[3][47] - 多传感器融合(激光雷达+GNSS+轮速)和退化场景优化成为技术重点[15][17][40]
Robotaxi市场竞争激烈:小马智行率先向文远知行开炮
36氪· 2025-06-24 00:13
行业前景 - 全球Robotaxi市场规模2024年预计为19.5亿美元,2030年有望达到437.6亿美元(Grand View Research)[1] - 天风证券预测2030年全球Robotaxi规模将达8349亿元人民币[1] 竞争格局 - 行业呈现萝卜快跑、文远知行和小马智行"三强争霸"格局[12] - 小马智行CTO楼天城称仅有Waymo、小马智行和百度达到规模化与无人化标准,其他公司落后两年半[2] - 文远知行CFO李璇公开反驳,指出小马智行运营问题并强调实际落地能力[2] - 两家公司均获Uber投资并达成中东市场合作协议[10] 公司背景 - 小马智行成立于2016年12月,由前百度自动驾驶首席架构师彭军和楼天城创立[6] - 文远知行前身景驰科技成立于2017年4月,由前百度自动驾驶团队韩旭和王劲创立[6] - 两家公司累计融资额均为13亿美元左右[9] 技术路线 - 小马智行采用"Robotaxi+Robotruck"双轮驱动,专注L4级全无人驾驶技术,强调冗余性与安全性[7] - 文远知行采取"全场景覆盖"策略,构建五大产品矩阵,注重技术泛化能力[9] - 小马智行每周生成超100亿英里虚拟测试数据[7] - 文远知行在瑞士苏黎世落地欧洲首个商业化机场Robobus项目[9] 财务数据 - 小马智行2022-2024年累计营收2.15亿美元(约16.46亿元人民币)[16] - 文远知行同期累计营收11.80亿元人民币[16] - 2024年小马智行Robotaxi营收占比9.7%,文远知行Robotaxi营收占比15.6%[16] - 小马智行2022-2024年累计研发投入5.17亿美元(约37.17亿元人民币)[14] - 文远知行同期累计研发投入29.08亿元人民币[14] 资产与现金流 - 2024年末文远知行总资产76.94亿元,净资产70.66亿元,资产负债率8.16%[18] - 2024年末小马智行总资产10.51亿美元,净资产9.69亿美元,资产负债率7.80%[18] - 文远知行2024年末现金及等价物42.68亿元,同比增长156.95%[19] - 小马智行2024年末现金及等价物5.36亿美元,同比增长25.82%[19] 市场表现 - 2024年10月文远知行率先登陆纳斯达克,首日市值44.91亿美元[12] - 小马智行一个月后上市,首日市值41.88亿美元[12] - 截至2024年6月小马智行Robotaxi车队累计路测里程超3350万公里[16] - 文远知行同期全球自动驾驶运行总里程超4000万公里[16] 国际化布局 - 小马智行聚焦中国市场,服务覆盖北上广深等一线城市核心区域[21] - 文远知行采取全球化战略,业务覆盖9国30城[21] - 小马智行2025年Q1乘客车费收入同比增长800%,日均订单量超15单[21] - 文远知行在阿布扎比开启纯无人驾驶Robotaxi试运营[10] 专利与知识产权 - 文远知行申请921项专利,小马智行申请93项专利[14] - 小马智行商标信息892条,文远知行商标信息381条[14]
上交&卡尔动力FastDrive!结构化标签实现端到端大模型更快更强~
自动驾驶之心· 2025-06-23 11:34
端到端自动驾驶研究进展 - 将类人推理能力融入端到端自动驾驶系统成为前沿领域 视觉语言模型(VLM)方法受到工业界和学术界广泛关注[1] - 现有VLM训练范式依赖自由格式文本标注 存在同义表达复杂性和信息冗余问题 增加模型学习难度和计算开销[1] - 基准模型通常依赖超70亿参数的大语言模型 导致高昂计算成本、内存消耗和推理延迟[3] NuScenes-S结构化数据集 - 数据集包含102K问答对 其中84K用于训练 18K用于测试[21] - 场景描述结构化要素包括:天气(5类)、交通状况(3类)、驾驶区域(7类)、交通灯(3类)、交通标志(8类)、道路状况(4类)、车道线(8类)、时间(2类)[7][8] - 感知预测任务包含:相机视角(6类)、2D边界框坐标、未来状态(7类)[12] - 决策任务分为横向移动(5类)和纵向移动(4类)[13] - 构建过程采用GPT预标注+人工细化的混合方式 通过规则提取关键目标[9] FastDrive算法模型 - 采用0.9B参数紧凑设计 相比传统70亿+参数模型大幅降低计算资源需求[4] - 网络架构遵循"ViT-Adapter-LLM"范式 包含视觉编码器(ViT主干)和LLM代理(Qwen2.5)[17][19] - 引入TokenPacker模块减少标记数量 提升推理速度[18] - 实现思维链式推理流程 完成场景理解→感知→预测→决策的全流程[19] 实验性能表现 - 语言指标:FastDrive256版本BLEU-4达70.36 ROUGE_L达87.24 显著优于DriveLM基准[22] - 场景理解准确率:天气识别99.95% 交通标志识别87.64% 全面超越对比模型[22] - 预测决策任务:在车道线状态预测(76.49%)和纵向控制决策(82.06%)等关键指标领先[22][25] - 消融实验证实结构化标注使决策准确率提升12.8%[24][25] 技术社区生态 - 自动驾驶技术社区覆盖30+技术方向 包括BEV感知、多传感器融合、轨迹预测等前沿领域[27] - 专业课程体系包含端到端自动驾驶、大模型部署、NeRF等20+细分方向[29] - 行业参与度:近300家企业和科研机构加入 形成4000人规模交流社区[27]