Real-time Object Detection
搜索文档
YOLO26不是第26代,而是“破局者”!颠覆性端到端架构重塑实时检测
自动驾驶之心· 2025-10-08 23:33
模型核心定位与设计原则 - YOLO26是YOLO系列实时目标检测器的最新演进版本,专为边缘和低功耗设备从头设计[5] - 模型引入一套简化设计,去除不必要复杂性,集成针对性创新,以实现更快、更轻量、更易于部署的模型[5] - 架构由简洁性核心原则驱动,是一个原生端到端模型,直接输出预测结果,无需非极大值抑制(NMS)[6] 关键技术创新 - 完全移除分布焦点损失(DFL)模块,简化推理并扩大对边缘和低功耗设备的硬件兼容性[10] - 采用原生端到端无NMS推理,取消独立后处理步骤,减少延迟,使生产系统集成更快、更轻、更可靠[11] - 引入改进的损失函数ProgLoss + STAL,显著提升检测精度,尤其在小目标识别方面有重大改进[12] - 采用新型混合优化器MuSGD,将SGD与Muon相结合,灵感来自Moonshot AI的Kimi K2,带来更稳定训练和更快收敛[13] 性能提升与优化效果 - 模型针对边缘计算专门优化,在CPU上推理速度最多提升43%,为无GPU设备提供近实时性能[7][14] - 模型家族在小目标上拥有更高精度,部署无缝,成为资源受限环境下最实用、最易部署的YOLO模型之一[7] 多任务支持能力 - YOLO26被设计为一个多任务模型家族,扩展了在不同计算机视觉挑战中的适用性[15] - 统一框架支持实时检测、实例分割、分类、姿态估计和定向目标检测,发布时均支持训练、验证、推理与导出[15][21] 目标检测性能指标(早期预览) - YOLO26n模型在640像素输入尺寸下,mAP 50-95(端到端)为39.8,参数量2.4百万,FLOPs 5.4十亿,CPU ONNX推理速度38.90毫秒[18] - YOLO26s模型mAP 50-95(端到端)为47.2,参数量9.5百万,FLOPs 20.7十亿,CPU ONNX推理速度87.16毫秒[18] - YOLO26m模型mAP 50-95(端到端)为51.5,参数量20.4百万,FLOPs 68.2十亿,CPU ONNX推理速度220.0毫秒[18] - YOLO26l模型mAP 50-95(端到端)为53.0,参数量24.8百万,FLOPs 86.4十亿,CPU ONNX推理速度286.17毫秒[18]