Workflow
自动驾驶
icon
搜索文档
自动驾驶基础模型应该以能力为导向,而不仅是局限于方法本身
自动驾驶之心· 2025-09-16 23:33
基础模型在自动驾驶感知领域的革命性变革 - 基础模型正将自动驾驶感知从特定任务深度学习模型转变为海量多样化数据集训练的多功能通用架构 [2] - 这些模型通过自监督或无监督学习策略在大规模数据集上预训练 基于Transformer等架构构建 能有效建模数据中的复杂交互关系 [4] - 基础模型展现出广泛泛化能力、高效迁移学习能力和对特定任务标注数据集依赖降低等显著优势 [4] 全新分类框架与核心能力 - 提出围绕动态驾驶环境中稳健性能需求的四项核心能力分类框架:通用知识、空间理解、多传感器鲁棒性和时序推理 [5] - 与传统"基于方法"的综述不同 该框架优先关注概念设计原则 提供"以能力为导向"的模型开发指导 [6] - 框架更清晰地揭示了基础模型的核心特性 为研究人员识别和解决特定缺陷提供系统性指导 [6] 通用知识能力 - 通用知识使模型能适应广泛驾驶场景 包括罕见或未见情况 并能合理推断可能结果和对未知智能体进行逻辑推理 [5] - 通过特征级蒸馏、伪标签监督和直接集成三种核心机制将基础模型集成到自动驾驶技术栈中 [37] - 视觉基础模型(VFMs)可直接集成到2D图像流水线 也能扩展至3D感知流水线 提供高层语义理解 [40] 空间理解能力 - 空间理解让自动驾驶车辆构建环境的连贯3D表示 捕捉物体身份、几何形状与上下文关系 [63] - 体积模型通过将传感器输入解读为3D场景的投影 构建密集、整体的环境表示 [65] - 3D掩码自动编码器通过"掩码输入-重建输出"策略 迫使模型学习场景级结构、物体边界和空间关系 [73] 多传感器鲁棒性 - 多传感器鲁棒性指系统在环境变化、传感器噪声或硬件性能下降时仍能保持感知精度与稳定性的能力 [80] - 跨模态对比学习构建统一表示空间 整合相机、激光雷达、毫米波雷达等不同传感器类型的互补信息 [82] - 多模态掩码自动编码器扩展至处理多模态输入 通过自监督重建任务让模型捕捉互补线索 [97] 时序推理能力 - 时序理解是对场景随时间演变过程进行推理 包括捕捉物体运动、跟踪遮挡物以及预测未来事件 [109] - 时序一致的4D预测模型从传感器观测序列中预测复杂动态环境的演变过程 [113] - 扩散概率模型能够表示复杂的多模态概率分布 成为解决未来场景不确定性问题的理想方案 [115] 技术实现与方法创新 - 知识蒸馏通过训练学生模型模仿教师模型的输出或内部行为 实现三类实现方式:输出级蒸馏、特征级蒸馏和关系级蒸馏 [17] - 神经辐射场(NeRF)采用隐式表示将场景建模为连续函数 通过可微体素渲染方程实现照片级真实感渲染 [24] - 3D高斯溅射(3DGS)采用显式表示将场景建模为一组3D高斯椭球体集合 通过可微前向光栅化器大幅提升渲染速度 [25] 模型对比与特性分析 - 基础模型相较于传统深度学习模型 在自动驾驶感知中的核心优势在于更优的泛化性和适应性 [36] - 视觉语言模型(VLMs)融合视觉基础模型与大语言模型的优势 实现视觉内容与文本语义对齐的联合表征 [35] - 大语言模型(LLMs)基于Transformer架构在海量文本语料上训练 具备强大的抽象、推理与指令遵循能力 [51] 当前挑战与未来方向 - 域间隙问题是核心挑战之一 需弥合基础模型预训练通用知识与自动驾驶感知特定需求之间的间隙 [59] - 幻觉风险带来严重安全风险 需深入探究故障根源并开发主动缓解策略 [60] - 延迟与效率问题与自动驾驶实时处理需求存在直接冲突 需通过模型优化技术构建更小、更高效的模型变体 [61]
北京亦庄举行自动驾驶体验活动 80余人感受智慧出行
中国新闻网· 2025-09-16 10:56
活动概况 - 北京亦庄举办自动驾驶专场活动 邀请80余名专业人士与市民参与 通过展厅参观 技术交流 试乘体验等环节展示技术实力[1] - 活动由北京经开区工委宣传文化部主办 旨在推动前沿产业成果与文旅体验融合 打造科技文旅新IP[2] - 北京经开区将于10月举办世界智能网联汽车大会及自动驾驶未来城市嘉年华[3] 技术展示内容 - 创新运营中心展厅分为序厅 技术厅 成果厅 云控指挥厅四大区域 系统展示自动驾驶建设过程与成果[1] - 技术厅通过实物展示和动态演示 具象化呈现车 路 云 网 图 安全六大领域的实践成果[1] - 云控指挥厅实时显示示范区测试车辆位置和状态数据 云控基础平台功能一目了然[1] 实际应用与体验 - 成果厅聚焦已落地出行场景和完整产业链布局 诠释智能网联汽车作为新质生产力的重要价值[1] - 活动现场设置轻舟小巴 百度小巴 文远小巴三款车型试乘体验 参与者反馈行驶平稳且能自动避让行人[2] - 互动交流环节围绕自动驾驶安全性和未来出行模式展开 工作人员结合真实案例解答疑虑[2]
AI商业化看广东①AI如何被买单?关键看撬动多大实际价值
南方都市报· 2025-09-16 10:52
政策支持与行业背景 - 国务院发布《关于深入实施"人工智能+"行动的意见》推动AI赋能千行百业 [1] - 广东省已连续发布三批合计13个行业78类"人工智能+"应用场景需求 [12][13][14] - 2025年1-5月广东省人工智能核心产业规模超1000亿元 工业机器人产量12.47万套同比增长33% 服务机器人产量416.98万套同比增长8.2% [14] 企业商业化实践 - 钛动科技服务8万+中国企业出海 业务覆盖全球200多个国家和地区 通过AI技术使企业利润空间从5%提升至80% [3][5] - 树根科技通过AI多模态智能体技术打造标准化工业解决方案 降低研发成本并提升价值产出比 [8] - 文远知行在广州黄埔区开展24小时纯无人Robotaxi商业化运营 已积累近三成忠实用户 每周至少乘坐一次 [9][11][12] 技术应用与产业赋能 - AI技术解决海外营销内容生成难题 快速优化验证投放策略 助力中国品牌实现海外"爆款" [5] - 工业领域通过AI实现解决方案标准化 使中小工业企业能以较低成本获得生产力大幅提升 [8] - 自动驾驶领域已形成五大产品线 通过通用技术平台WeRide One降低研发运营和供应链成本 [11] 区域发展优势 - 广东拥有完善科技产业链供应链和最齐全产业门类 为AI商业化提供丰富探索空间 [1] - 广东建立跨部门人工智能机器人应用场景拓展协调机制 培育开发应用市场 [14] - 依托广阔应用场景优势 开发适应特定行业需求的垂直领域大模型 [14]
自动驾驶:万亿赛道的终极博弈,下一个十年谁主沉浮?
格隆汇APP· 2025-09-16 09:53
若说过去十年是移动互联网重塑生活的黄金期,未来十年,自动驾驶必将成为改写人类出行逻辑的核心 力量。 从科技巨头到传统车企,再到资本市场的敏锐玩家,都清楚这不仅是技术革新,更是对万亿级市场蛋糕 的激烈角逐。 如今FSDV12已实现"端到端决策",无需依赖预设规则,直接输出驾驶指令,复杂场景应对能力显著提 升。但短板也突出:暴雨、大雾、强光等场景下,摄像头感知精度易受影响。 技术路线之争:两条路径的较量与进化 如今试驾主流新能源车,L2+级辅助驾驶已不新鲜:自动跟车、车道保持、高速领航,部分车型甚至能 实现城市道路自主变道。 2023年起,城市NOA快速落地,标志着自动驾驶从"简单高速场景"迈向"复杂城市环境",但这只是行业 序幕。 按国际汽车工程师学会(SAE)标准,自动驾驶分L0至L5六级。目前量产车型多处于L2向L3过渡阶 段,真正的"无人驾驶"(L4/L5)仍局限于特定场景——如Waymo在旧金山的全无人出租车、封闭园区 的自动驾驶物流车。 即便头部企业有局部突破,L4级大规模落地仍面临技术可靠性、法规适配性与成本控制三重考验,而 行业在技术路线选择上已形成两大阵营: 1.纯视觉派:特斯拉的"数据驱动"之 ...
自动驾驶:万亿赛道的终极博弈,下一个十年谁主沉浮?
格隆汇APP· 2025-09-16 09:21
自动驾驶行业核心观点 - 自动驾驶正经历从辅助驾驶向完全无人化跨越的关键拐点 是未来十年改写人类出行逻辑的核心力量 有望重塑万亿级市场格局 [2] - 行业处于爆发前夜 2024年车企加速落地城市NOA和Robotaxi试点 2025年可能成为自动驾驶商业化关键年 [15][18] - 技术路线分为纯视觉派(特斯拉为代表)与多传感器融合派(Waymo/华为为代表) 两者均在快速进化 核心在于AI大模型在决策规划的突破 [5][6] 技术路线分析 - 纯视觉路线依靠摄像头模拟人类视觉 搭配AI算法实现感知决策 优势在于低成本摄像头和超千万辆运营车队带来的海量数据反哺 但暴雨大雾等场景感知精度受限 [5] - 多传感器融合路线通过激光雷达 毫米波雷达和摄像头协同工作提供安全冗余 早期激光雷达成本达数十万元 现已降至千元级 为量产铺平道路 [6] - 特斯拉FSD V12实现端到端决策 直接输出驾驶指令 融合派普及BEV+Transformer架构 行业印证"感知硬件的尽头是算法"判断 [6] 自动驾驶生态层级 - 感知层由摄像头 激光雷达和毫米波雷达构成矩阵 国内禾赛 速腾聚创激光雷达性能接近国际水平 舜宇光学 欧菲光占据车规级高像素镜头重要份额 [7] - 决策层依赖芯片算力与算法规划 英伟达DRIVE Orin提供2000TOPS算力成L4首选 地平线征程5 黑芝麻智能A1000填补国产算力空白 [8] - BEV+Transformer架构让车辆能预判交通参与者轨迹 使决策更贴近人类直觉 [9] - 执行层通过线控底盘和电子转向将决策转化为动作 博世 大陆及国内德赛西威实现线控底盘量产 [10] - 支持层依托5G与V2X实现车辆实时联网 云计算支撑数据存储与算法训练 仿真平台大幅降低路测成本 Waymo仿真测试里程超数十亿英里 是实际路测数十倍 [11] 商业化进展与挑战 - 2023年起城市NOA快速落地 标志着自动驾驶从简单高速场景迈向复杂城市环境 [4] - 目前量产车型多处于L2向L3过渡阶段 L4/L5真正无人驾驶仍局限于特定场景 如Waymo在旧金山的全无人出租车和封闭园区物流车 [5] - L4级大规模落地面临技术可靠性 法规适配性与成本控制三重考验 [5] - 政策层面各国对L3/L4级上路标准和事故责任认定仍在探索 德国允许L3级上路 中国北京上海开放Robotaxi测试但需跨区域法规协同 [12] - 伦理安全层面需解决算法选择 数据隐私保护和网络安全防御等问题 [12] 产业链投资机会 - 整车与解决方案提供商如特斯拉 Waymo及传统车企自动驾驶部门位于产业链前端 潜在回报高但风险最大 [16] - 关键技术供应商包括芯片(英伟达 高通 地平线)和传感器(禾赛 速腾聚创 Luminar)提供核心组件 商业模式较稳定 [16] - 基础设施与服务提供商涵盖高精地图(百度地图 四维图新) 仿真测试(腾讯 ANSYS)和云平台(阿里云 AWS)盈利模式更清晰 [16] - 应用与运营服务商包括Robotaxi运营 自动驾驶物流和智慧交通 聚焦特定场景商业化 [16] - 投资需关注有技术壁垒和商业化路径清晰的公司 短期看L2+/L3普及带来的硬件机会 中期看特定场景L4商业化突破 长期关注完全自动驾驶生态成熟 [16]
探寻北京“国际范儿” 外国网络达人京城开启“机”智生活
中国新闻网· 2025-09-16 08:09
探寻北京"国际范儿" 外国网络达人京城开启"机"智生活 中新网北京9月16日电 漫步机器智能世界、驰骋算法编织的路网……第五届"北京·国际范儿"短视频大赛 采风活动近日走进北京经济技术开发区,来自拉美和加勒比22国的30余名"网络达人",在北京探寻"智 造"背后的硬核科技。 北京"机器人+"未来已来 今年4月首次举办人形机器人半程马拉松赛的北京亦庄,带着"运动员"参加了今年8月在北京举办的首届 世界人形机器人运动会。 "北京这座城市既承载着厚重历史,让人感受到中国的古老文明,又展现出对未来科技的探索,包括举 办一系列机器人体育赛事等。"第一次来中国的DIEGO BOLSON RUZZARIN表示,尽管这些赛事还处 于起步阶段,但将带动工程师和科学家不断挑战自我,让机器人变得更灵活、更智能,帮助人类解决越 来越多的生产生活问题。 北京无人驾驶向未来 从机器人大世界出发,网络达人登上自动驾驶车辆。待车内乘客系好安全带后,车辆缓缓起步,沿道路 平稳前行,途中可实现识别红绿灯、换道超车,并"彬彬有礼"避让行人、非机动车等,最终将乘客送达 目的地。 全程流畅丝滑的自动驾驶,是近年来北京未来产业蓬勃发展的生动缩影。 得益 ...
马斯克光环加持下特斯拉(TSLA.US)重回400美元上方!基本面仍存隐忧之际长期行情待考量
智通财经网· 2025-09-16 08:03
股价表现与催化剂 - 特斯拉股价周一收涨3.56%至410.04美元,为今年2月以来首次突破400美元大关,盘中一度涨至425.70美元 [1] - 过去五个交易日股价上涨11%,相对强弱指标(RSI)达到74.84,处于极度超买状态 [6] - 股价上涨主要受马斯克1万亿美元薪酬方案获批及10亿美元增持股票推动,董事会称其为推动公司向AI及机器人转型的"世代领袖" [1] 业务转型战略 - 公司发布"宏图计划第四篇章",重点将人工智能融入现实世界产品与服务,打造"可持续的富足未来" [4] - 自动驾驶出租车(Robotaxi)和Optimus机器人被确定为最重要事项,预计未来约80%价值将来自Optimus机器人 [4] - Robotaxi服务已在德克萨斯州奥斯汀、加州湾区推出并向公众开放应用,高下载量显示民众体验意愿强烈 [5] 电动汽车业务挑战 - 8月在美国市场份额降至近八年低点38%,较此前高达80%的水平呈现阶梯式下跌 [1] - Model Y改款未达市场高预期,Cybertruck销量增长令人失望,市场竞争不断加剧 [4] - 本月底后将失去联邦税收抵免,可能使年底情况更为严峻 [4] 新业务进展与前景 - Robotaxi服务正扩展至内华达、佛罗里达和亚利桑那州,车辆成本5-6万美元显著低于Waymo的20万美元 [6] - Optimus机器人今年产量目标5000台,预计售价2-3万美元,目标2030年实现数百万台销量 [6] - 自动驾驶和机器人业务增长速度尚不足以完全弥补电动汽车业务增长放缓 [4] 估值水平 - 远期市盈率达233.80倍,远超同行均值18.06倍,溢价1194.56% [8] - 估值长期难以用常规逻辑解释,市场尚未就公司向AI与机器人转型达成定价共识 [8] - 非GAAP远期市盈率233.80较5年平均112.88高出107.13% [8] 短期催化因素 - 税收抵免到期前消费者抢购可能推动本月电动汽车销量超预期 [9] - 若美联储降息幅度超预期或政策指引更鸽派,可能进一步刺激电动汽车销量并推动股价 [9]
哈啰Robotaxi首次亮相 跨界突围之路前景几何?
犀牛财经· 2025-09-16 06:31
公司业务动态 - 哈啰于9月11日首次对外亮相首款自研Robotaxi车型 采用端到端一体化架构并在座舱内引入AI Agent [2] - 公司计划2027年向市场投放超5万辆Robotaxi 展现对自动驾驶业务的高度期待 [2] - 哈啰2016年以共享单车业务起家 目前业务涵盖两轮共享服务和四轮出行服务 已完成十余轮融资 投资方包括蚂蚁集团、复星集团等机构 [2] - 2023年3月公司通过收购永安行股权强化出行领域布局 成为其控股股东与实控人 [2] - 今年6月23日哈啰联合蚂蚁集团与宁德时代成立上海造父智能科技有限公司 三方共同投资30亿元 分工明确:哈啰负责Robotaxi业务及研发 蚂蚁提供AI技术支持 宁德时代提供动力电池与底盘技术 [3] 行业竞争格局 - Robotaxi赛道已吸引百度、小马智行、文远知行等众多玩家入局 但大多仍处于试点运营阶段 尚未实现大规模商业化落地 [3] - 头部企业在自动驾驶领域投入巨大:特斯拉累计投入超200亿美元(约1400亿元) 百度Apollo累计投入超千亿元 小马智行和文远知行单轮融资达数亿美元 累计投入逼近百亿元量级 [3] - 先行企业如Waymo、百度Apollo通过大量路测里程与广泛场景覆盖 建立起难以超越的数据与技术优势 [4] 公司战略动机 - 哈啰长期受盈利问题困扰:共享单车业务盈利难 顺风车业务低毛利瓶颈难破 金融业务在强监管与用户信任危机下增长受限 [2] - 公司通过布局Robotaxi赛道试图寻找新的增长突破口 [2] 行业发展挑战 - Robotaxi赛道需要大量资金投入及技术积累 存在较高技术壁垒 [3][4] - 行业商业化进程面临政策、市场需求、安全标准等多重不确定性因素 [5] - 哈啰作为后来者面临多重挑战:30亿元联合投资规模与头部企业投入相比存在显著差距 技术积累方面难以在短时间内弥补与先行者的数据差距 [3][4]
无人物流车上市即交付 佑驾创新开拓增长新曲线
证券日报网· 2025-09-16 04:12
本报讯(记者张文湘)9月15日,深圳佑驾创新科技股份有限公司(以下简称"佑驾创新")于深圳正式发布旗 下无人物流品牌"小竹无人车",实现从智驾技术L1到L4的又一次极致跨越,为行业带来了全新的车规 级无人物流产品选择。 此次首发的两款小竹无人车车型为T5及T8,佑驾创新基于扎实的数据闭环能力,以及过往十余年行业 深耕中积累的海量道路数据,并针对无人物流场景进行针对性优化,帮助小竹无人车以极快的速度培养 公开道路应对、复杂路况通过、室内外园区自主巡航、作业区自动泊车及主动安全等核心能力。基于不 断迭代的技术范式与全场景数据底座,佑驾创新的前装量产载人业务以及无人物流的载货业务也得以双 向赋能。 佑驾创新创始人兼董事长刘国清表示:"公司希望以自动驾驶破局者的身份,让更先进的L4技术,在更 多元、更复杂的场景,为用户创造更多价值。" 目前,佑驾创新已基于L1-L4全维智驾技术实力搭建起丰富的产品矩阵,佑驾创新2025年中期业绩数据 显示,其L4自动驾驶iRobo业务在报告期内实现了突破性进展,半年内营收破千万元。其无人小巴业务 已于今年2月份,率先在苏州完成商业化落地,并在黑龙江、上海等地交付,逐步成为公司收入的新 ...
佑驾创新盘中涨超10% 公司发布无人物流品牌“小竹无人车” 实现L4级物流自动驾驶
智通财经· 2025-09-16 03:43
股价表现 - 盘中涨幅超过10% 截至发稿时上涨6.34%至27.18港元 成交额达1.35亿港元 [1] 业务进展 - 公司于9月15日正式发布无人物流品牌"小竹无人车" 首批车辆已下线并向合作伙伴交付 [1] - L4级自动驾驶方案已在园区、通勤及机场场景实现商业化落地 [1] - 与深圳邮政及东部公交达成战略合作 围绕无人物流车与公交场景融合等四大方向推进 [1] 战略合作 - 获得深圳邮政与东部公交认可 于9月3日签订战略协议 [1] - 合作重点包括公交场站空间复合利用、跨场景业务拓展及劳动用工协同创新 [1] - 目标实现物流效率与公共资源利用率的双向提升 [1]