Workflow
通用障碍物识别
icon
搜索文档
儿童能避开的纸箱,难倒了天价开发的AI司机
第一财经· 2025-10-20 04:12
文章核心观点 - 终端市场对辅助驾驶能力的认知存在显著偏差,消费者认为简单的场景(如识别静止纸箱、砖头)对智驾系统而言是技术难题,这种“反常识”的认知差异是当前智驾安全问题的核心 [3][5][6] - 智驾系统基于数据和概率进行感知,其逻辑与人类基于常识的感知方式存在根本不同,导致系统在处理未标注的通用障碍物和静止物体时面临挑战,并倾向于谨慎忽略静止物体以避免频繁“幽灵刹车” [10][11] - 行业正通过多传感器融合、收集极端案例数据以及加强终端市场教育(如制定试驾培训材料)来明确能力边界、提升安全性并推动技术进步,目标是实现长期的完全自动驾驶 [12][13] 辅助驾驶的认知偏差 - 信息从智驾专业团队到车企营销团队,再到终端消费者传递过程中会出现失真和模糊,导致消费者对辅助驾驶能力产生过高预期 [5] - 消费者普遍认为辅助驾驶应能轻松识别大型静止物体(如工程车)或常见障碍物(如50厘米纸箱),但这些场景实际是当前技术的难点,高度依赖高性能激光雷达,纯视觉方案更难应对 [6] - 人类大脑是精密的感知模型,能轻易调用常识识别物体,而机器需依赖海量标注数据训练,对未标注的通用障碍物识别能力有限 [7][11] 技术挑战与系统逻辑 - 智驾系统将摄像头捕捉的像素点或激光雷达的点云数据通过标注分类,若物体未被标记则无法识别,这与人类直观认知形成反差 [11] - 系统对静止物体识别极其谨慎,因为道路大部分静止物(如路灯、阴影)无需避让,过度反应会导致频繁“幽灵刹车”从而带来更大安全风险 [11] - 移动物体因是道路异常信号,系统可通过连续帧图像轻松计算其速度和轨迹,从而更有效地作出反应 [11] - 技术案例显示,系统可能误判广告牌上的车辆图片或起跑人像为真实障碍物引发急刹,这体现了机器感知基于概率的特性 [9][10] 行业解决方案与进展 - 技术层面采用多传感器融合(如激光雷达、4D毫米波雷达)提供感知冗余,并加速收集极端案例数据以填充模型认知空白 [12] - 企业加强终端市场教育,例如与车企合作制定试驾路线培训材料,让销售人员在试驾中明确告知用户适用场景和能力边界 [13] - 行业价值观强调对安全的敬畏心,指出汽车软件工程需高要求纪律,与互联网产品快速迭代模式不同 [12] - 行业设定技术发展目标为3年实现“脱手”驾驶、5年“闭眼”驾驶、10年“随心”驾驶的完全自动驾驶愿景 [12]