自动驾驶之心
搜索文档
45万亿!中国智驾的新风口来了
自动驾驶之心· 2025-12-15 11:33
以下文章来源于亿欧汽车 ,作者江山美 亿欧汽车 . 专注汽车出行领域科创报道与投资价值研究 L4级智能驾驶商业化进程显著提速,呈现政策、技术、场景三轮驱动格局。 政策层面,国家级规划与五城全域开放试点明确事故责任划分,破除制度障碍; 技术层面,系统成本持续下探,车路云协同能力增强,提升复杂环境可靠性; 场景层面,Robotaxi、无人配送、干线物流等多场景试点加速从低速封闭向中高速开放场景跨越。 在政策红利释放、核心技术进步与应用场景拓展的共同作用下,2025年五城L4车辆保有量预计突破10万辆,带动相关产业链规模超200亿元,标志着"全民 智驾"元年正式开启。 L4智驾的发展背景概览 作者 | 江山美 来源 | 亿欧汽车 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 本文只做学术分享,如有侵权,联系删文 L4级智驾已成为跨越式技术路线的主战场,产业生态庞大、格局趋明。 资本集中注入头部企业,政策逐步开放多类场景的L4智驾试点,商业化按"中低速封闭场景→高速开放场景"路径逐级拓展; 技术端以"车-云"与 ...
小鹏最新一篇基于潜在思维链世界模型的FutureX,车端可以借鉴...
自动驾驶之心· 2025-12-15 06:00
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 论文作者 | Hongbin Lin等 编辑 | 自动驾驶之心 港中文联合小鹏最新的一篇工作,很有意思。基于潜在思维链世界模型增强端到端的能力, 有一些值得业内尝试的改进点: 一、背景回顾 端到端(E2E)自动驾驶指的是通过完全可微分的映射,直接将多模态原始传感器数据流转换为运动规划或底层驱动指令的技术流水线。该领域在算法方案和基准测 试两方面均取得了快速发展。尽管面临固有挑战,现有方法仍实现了显著进步。 在这些成功背后,现有端到端自动驾驶系统通过单一神经网络直接将传感器输入映射为控制输出,执行高效的一次性前向预测,而无需进一步"思考"。这导致它们在 复杂环境中缺乏适应性和可解释性(图1第二行)。在人类认知中,驾驶员在执行任何操作前,都会在脑海中模拟可能的未来场景:预测周围车辆的运动趋势、场景的 演变方向,以及每种可能行为的潜在结果(图1第一行)。这种内在推理能力使人类能够做出安全且贴合场景的决策。因此,对于端到端系统而言,在高度动态的交通 环境中推断未来场 ...
世界模型与自动驾驶:最新算法&实战项目(特斯拉、视频、OCC等)
自动驾驶之心· 2025-12-15 06:00
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 世界模型,近一年自动驾驶学术界和工业界的热词。很多小伙伴咨询柱哥,有没有一门系统讲解世界模型和自动驾驶的精品课程,筹备了很久终于和大家见面! 我们联合 工业界大佬 共同开展,先前的《端到端与VLA自动驾驶小班课》备受大家好评,因此我们进一步推出这门世界模型小班课, 课程聚焦于通用世界模型、 视频生成、OCC生成等世界模型算法,涵盖特斯拉世界模型、李飞飞团队Marble等。欢迎大家加入学习~ 早鸟优惠!开课即止~ 讲师介绍 Jason:C9本科+QS50 PhD,已发表CCF-A论文2篇,CCF-B论文若干。现任国内TOP主机厂算法专家,目前从事端到端、大模型、世界模型等前沿算法的预研和量 产,并已主持和完成多项自动驾驶感知和端到端算法的产品量产交付,拥有丰富的端到端算法研发和实战经验。 课程大纲 这门课程讲如何展开 第一章:世界模型介绍 第一章主要针对自动驾驶世界模型概括性的内容讲解。 这一章老师会先复盘世界模型和端到端自动驾驶的联系,接着讲解世界模型的发展历史以及当下的应用案 例。然后介绍世界模型有哪些流派 ...
理解 RL学习的本质!
自动驾驶之心· 2025-12-15 00:04
原文链接: https://zhuanlan.zhihu.com/p/1972781108128155202 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 作者 | wangleineo 来源 | 青稞AI >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 本文只做学术分享,如有侵权,联系删文 最近看了几篇关于RL学习的论文,发现这几篇研究存在着一些内在联系,综合起来看,也许有助于我们理解RL学习方法的本质。 破除迷信 Does RLVR enable LLMs to self-improve? 第一篇文章是最近备受关注的一篇论文,来自清华的LEAP实验室,在今年的NeurIPS拿下了全满分,获得最佳论文奖: https://arxiv.org/abs/2504.13837 这篇论文开宗明义提出了一个问题: RL学习真的能让LLM获得超越基础模型的推理能力吗? 研究结论很确切,不能 。论文用实验证明,RLVR后模型的能力完全在基础模型的能力范围内,只是搜索效率提高了,能更高效 地找到问题的解。而基础模型不能解决的问题,RLVR的模型一样不能解决。 证明 ...
「CV顶会王」李弘扬投身具身智能赛道!
自动驾驶之心· 2025-12-15 00:04
公司创业动态 - 香港大学数据科学研究院助理教授、上海人工智能实验室OpenDriveLab研究科学家李弘扬已进入具身智能赛道创业 [3] - 公司围绕UniVLA的研究方向进行机器人Manipulation攻关 目前已形成长程任务的Demo [3] - 公司已组成数十人的研发团队 研究领域涵盖VLA、机器人、无人驾驶和端边计算芯片 [4] - 公司走的同样是「基座模型 + 机器人本体」的全栈自研路线 [10] - 公司愿景是通过提升少样本泛化能力 实现人形机器人在全场景下的规模化落地应用 [10] - 团队即将发布的核心模型已达到国际一流水准 且在技术跟商业化上足够清晰 [11] 创始人学术与技术成就 - 创始人李弘扬的主要研究方向为自动驾驶、具身智能及端到端智能系统应用 [6] - 其主导的《Planning-oriented Autonomous Driving》获得IEEE CVPR 2023最佳论文奖 掀起自动驾驶界「端到端」巨浪 [6] - 提出的UniAD框架将目标检测与跟踪、地图预测、轨迹预测、占据栅格预测、规划整合为同一个基于Transformer的端到端网络框架 在公开数据集nuScenes的所有相关任务上都大幅优于同类型SOTA方法 [6] - 提出的俯视图感知方法BEVFormer曾入选2022年AI论文100强 成为业界视觉检测基准 [7] - 在CVPR、ICCV、ECCV、NeurIPS、CoRL、ICLR、TPAMI、TIP等国际顶尖会议/期刊上发表论文数十篇 多次担任国际顶尖会议领域主席 [7] - 在具身智能领域 其团队构建了超大规模真实机器人操控数据集「AgiBot World」 基于百万真机、千万仿真数据集 覆盖了五大行业场景 [7] - 2025年5月 团队在arXiv平台发表论文《UniVLA: Learning to Act Anywhere with Task-centric Latent Actions》 提出以任务为中心的潜在动作框架 [7] 核心技术框架UniVLA - UniVLA框架通过无监督学习从视频数据中推导出潜在动作表示 支持跨实体和环境的机器人策略学习 实现机器人高效跨场景部署 [7] - 框架特点在于通过两阶段训练解耦任务相关与无关动态 利用DINO特征空间和语言指令增强语义对齐 结合轻量级解码器适配不同机器人硬件 [9] - 相比传统方法 UniVLA显著降低了对标注数据的依赖 仅需少量数据即可在多任务基准测试中达到最优性能 并支持从互联网视频到真实机器人的高效迁移 [10] 行业观点与趋势 - 李弘扬在2025地平线技术生态大会上表示 具身智能一定会体现出Scaling law 目前全球真正算得上做过Scaling law实验的只有一家公司 即Generalist AI(GEN-0模型) [10] - 如何就算法、数据、硬件或Infra建立一套高效率的数据采集系统 在具身智能领域是非常关键的课题 [10] - 近两年 除了有数位自动驾驶大拿创建具身智能公司外 也有多位学界专家选择投身具身智能领域 包括卢策吾、卢宗青、邵林、王鹤、赵明国等知名学者 [11]
中游智驾厂商正在快速抢占端到端人才......
自动驾驶之心· 2025-12-15 00:04
行业技术发展趋势 - 智能驾驶领域的技术焦虑正在产业链中游厂商间快速传播[1] - 业内认为,端到端等前沿技术的大规模量产起点将在明年[2] - 当前智驾前沿技术发展放缓,量产方案趋同,L2级智能驾驶正走下沉路线[2] - 随着明年L3法规的进一步推进,中游厂商面临迫切的技术升级压力[2] - 近期许多公司的算法负责人正积极寻求了解端到端、世界模型、VLA、3DGS等前沿技术[2] 市场与量产现状 - 中国二十万以上的乘用车年销量约为700万辆[2] - 头部新势力品牌在此价格区间的销量占比不及三分之一[2] - 已实现端到端技术量产的车型占比更低[2] - 端到端技术的成熟被视为开启更大规模量产的关键[2] - 地平线公司宣布将进军10万级市场,表明高阶智驾正迅速向更多国民车型下沉[2] 技术实施与人才需求 - 端到端自动驾驶不仅仅是一个算法,其落地需要完善的云端与车端基础设施、数据闭环、工程部署、闭环测试、模型优化及平台开发等全套能力[2] - 可以预见,市场对中阶智能驾驶相关岗位的需求将更加旺盛[2] - 端到端和VLA(视觉语言动作模型)领域的招聘需求预计将显著增长[3] 行业培训动态 - 为应对技术升级需求,市场出现了针对端到端和VLA技术的实战培训课程[3] - 相关课程由工业界与学术界的专家联合开展,聚焦量产落地[3] - 课程内容涵盖导航信息应用、强化学习优化、Diffusion和自回归模型量产经验、时空联合规划等核心模块[3] - 另有课程专门梳理BEV感知、大语言模型、扩散模型和强化学习在端到端领域的应用,并设计相关实战项目[6] - 针对VLA领域,有课程从VLM(视觉语言模型)解释器到模块化、一体化及推理增强VLA进行全面梳理,并包含从零搭建模型的大作业[11] - 课程讲师及团队背景雄厚,多来自国内顶级主机厂、Tier1供应商及顶尖高校,拥有丰富的算法研发、预研及量产交付经验[5][8][13][14]
复旦&上交最新!一篇长达40页的自动驾驶空间检索范式SpatialRetrievalAD
自动驾驶之心· 2025-12-15 00:04
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 现有自动驾驶系统非常依赖车载传感器进行实时精确的环境感知。然而,这种模式受行驶过程中的感知范围限制,在视野受限、遮挡或黑暗、降雨等极端条件下常出 现性能失效。相比之下,人类驾驶员即使在能见度不佳的情况下,仍能回忆起道路结构。为了让模型具备这种"回忆"能力,针对这个特点, 复旦可信具身智能和上交 等合作 ,将离线检索的地理图像作为额外输入引入系统。这些图像可从离线缓存(如谷歌地图或已存储的自动驾驶数据集)中轻松获取,无需额外传感器,是现有自 动驾驶任务的即插即用型扩展方案。 在实验中,首先通过谷歌地图API检索地理图像,扩展了nuScenes数据集,并将新数据与自车轨迹对齐。并在五个核心自动驾驶任务上建立了基准:目标检测、在线建 图、占用预测、端到端规划和生成式世界模型。其中在线建图mAP提升13.4%,占用预测静态类mIoU +2.57%,夜间规划碰撞率从0.55%降至0.48%,为复杂场景自动驾 驶提供低成本、高鲁棒的感知增强方案。大量实验表明,该扩展模态 ...
扒了一下今年各家具身公司的量产情况和订单金额......
自动驾驶之心· 2025-12-14 02:03
以下文章来源于具身智能之心 ,作者具身智能之心 具身智能之心 . 与世界交互,更进一步。具身智能之心是国内具身与机器人领域的专业技术平台,集企业咨询、在线教 育、展会服务、线下培训、硬件研发、技术方案为一体。 点击下方 卡片 ,关注" 具身智能 之心 "公众号 25年具身机器人量产的情况究竟是怎么样的?今年的答卷如何?具身智能之心也为大家做了一次 调研。 近期Atlas项目负责人在社交媒体上爆料:现代汽车承诺部署数万台Atlas机器人。 计划在未来几年内,在其制造和物流业务中部署数万台机器人,包括Atlas人形机器人、Spot四足机器人和 Stretch集装箱卸货机器人。针对量产能力的不足,作为传统汽车制造业的龙头,现代汽车近期还表示将整合汽 车制造领域的专业生产能力,助力波士顿动力扩大机器人产量。 看到这里,25年具身机器人量产的情况究竟是怎么样的?今年的答卷怎么样?具身智能之心也为大家做了一次 调研,已经放到我们的具身智能之心社区内,欢迎加入交流。 9月,其新一代工业机型Walker S2,拿下某国内企业2.5亿元订单,刷新了全球人形机器人单笔合同纪录。 2025年全球机器人量产订单 最近一直想盘下今年各 ...
自动驾驶之心在招募业务合伙人!
自动驾驶之心· 2025-12-14 02:03
联系我们 作为国内自动驾驶领域创作的技术平台,我们期望能够在这波激流中贡献自己的力量,成为一个真的能 给行业带来价值的平台。 众人拾柴火焰高,我们需要更多优秀的伙伴加入我们。 点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近15个 方向 学习 路线 岗位说明 大家好,我是柱哥。最近收到很多小伙伴的咨询和求助,希望我们能够联系更多的技术专家分享业内最 新的动态和观点。自动驾驶已经进入下半场,行业的难点和痛点需要更多有志之士参与进来一起突破。 后面我们将陆续为大家增加圆桌访谈、实战&工业级课程、咨询等各类输出。 主要面向自动驾驶培训合作(B端主要面向企业和高校、研究院所培训,C端面向较多学生、求职类人 群)、课程开发和原创文章创作。 主要方向 包括但不限于:自动驾驶产品经理、4D标注/数据闭环、世界模型、VLA、自动驾驶大模型、强化学 习、端到端等多个方向。 待遇与合作方式,欢迎添加微信wenyirumo做进一步沟通。 ...
理想下一步的重点:从数据闭环到训练闭环
自动驾驶之心· 2025-12-14 02:03
点击下方 卡片 ,关注" 自动驾驶之心 "公众号 戳我-> 领取 自动驾驶近30个 方向 学习 路线 >>自动驾驶前沿信息获取 → 自动驾驶之心知识星球 理想汽在ICCV'25期间也分享了些新东西!目前还没有视频对外。 VLA团队负责人詹锟老师做了一场世界模型的presentation,名为World Model: Evolving from Data Closed-loop to Training Closed-loop。自动驾驶之心第一时间做了解 读分享给大家~ 首先是介绍下理想VLA司机大模型: 回顾了理想汽车智能驾驶的发展路线,从规则时代的轻图和无图,再到基于AI的E2E+VLM快慢双系统和VLA, 这四个方案中Nav(导航)是重点突出的模块。 下面介绍的是数据闭环的价值。左上角这张图是一个完整的数据闭环流程: 影子模式验证→经由数据触发回传到云端进行数据挖掘→有效样本进行自动标注→生 成训练集训练模型→模型下发验证性能。 这个过程已经可以做到一分钟的数据回传。 目前已经有15亿公里的驾驶数据,200+的Trigger来生产15-45s的Clip数据。 目前理想的端到端量产版本MPI已经到了220+, ...