专栏名称: 智驾实验室
欢迎关注“智驾实验室”!本公众号专注于自动驾驶领域,为您带来世界模型的最新研究,多模态大模型的深入解析,以及多模态大模型在自动驾驶领域的应用与落地。在这里,您可以了解到自动驾驶技术的最新动态,洞察行业趋势,与我们一起探索未来出行的无限可能。
目录
相关文章推荐
51好读  ›  专栏  ›  智驾实验室

YOLO-PPA:结合并行感知与部分卷积,提升交通标志检测效率与准确性 !

智驾实验室  · 公众号  ·  · 2024-09-14 08:00

正文

ADAS Laboratory




点击上方 蓝字 关注 智驾实验室

加入【 智驾实验室 】交流群, 获取更多内容和资料

YOLO-PPA based Efficient Traffic Sign Detection for Cruise Control in Autonomous Driving

在自动驾驶系统中,高效准确的检测交通标志非常重要。然而,距离越远,交通标志越小,现有的目标检测算法很难检测到这些微缩的交通标志。此外,车辆中的嵌入式设备的性能有限制了检测模型的规模。

为了解决这些挑战,本文提出了一种基于YOLO-PPA的交通标志检测算法。首先,作者将并行感知patch注意力(PPA)引入YOLO。

PPA利用多分枝特征提取策略和空间-通道注意力,在不同的尺度和 Level 上捕获特征,从而增强了长时间交通标志的特征提取能力。为了提高模型效率,同时不降低准确性,作者将部分卷积(PConv)引入YOLO的C2F模块。

在模型训练期间,作者引入APLoss,用它来替换原始分类损失,以解决交通标志类别严重的失衡问题。

在GTSDB数据集上的实验结果表明,与原始YOLO相比,所提出的算法在推理效率上提高了11.2%,mAP@50也提高了93.2%,这证明了所提出的YOLO-PPA的有效性。

Ccs Concepts

目标检测,并行化卷积感知注意力,深度学习,计算机视觉,自动驾驶,YOLO,交通标志检测,其中,目标检测指的是使用计算机视觉技术识别并定位图像或视频中的目标物体。并行化卷积感知注意力的计算方法可以提高计算机视觉系统的性能。

深度学习是一种广泛应用于计算机视觉领域的技术,能够有效地实现目标检测等功能。

在自动驾驶领域,计算机视觉技术可以用于识别道路和其他障碍物,从而提高安全性和提高驾驶效率。

YOLO(You Only Look Once)是一种基于深度学习的图像目标检测算法,已经广泛应用于交通标志检测等领域。

1 Introduction

随着自动驾驶技术的迅速发展,交通标志检测已成为自动驾驶车辆巡航控制系统中的关键话题。交通标志为无人驾驶车辆提供了重要的道路状况信息,如限速、行驶方向、停车指示等,这些信息对于车辆导航和驾驶决策至关重要。在复杂道路环境下准确检测交通标志可以显著提高驾驶 safety and efficiency,从而避免交通事故。然而,由于交通标志的多样性和复杂道路环境以及车辆的的高速动态变化,交通标志检测在自动驾驶系统中的实际应用面临许多挑战。

大多数传统的检测算法在大目标和简单背景上表现良好,但当处理小交通标志和复杂背景时,它们的准确性和 robustness 常常会降低。首先,交通标志通常是小尺寸的,特别是从远处观看。这些标志只占图像中的少量像素,很容易被忽略或误检。此外,交通标志通常部署在复杂背景下。如树木、建筑物和其他交通设施的干扰,进一步增加了检测的难度。

近年来,基于深度学习的目标检测算法在各个领域得到了广泛应用 ,在交通标志检测领域也取得了显著的进展。例如 YOLO[6] (You Only Look Once)、Faster R-CNN 和 SSD (Single Shot MultiBox Detector) 模型,由于其优越的准确性和实时性能,在交通标志检测任务中得到广泛使用。这些模型以端到端的方式直接从图像中提取特征,并实现了有效的交通标志检测。然而,尽管这些模型在许多公开可用的数据集上实现了良好的检测精度,但在实际应用中仍存在一些挑战。不同交通标志的形状、颜色、大小和内容变化很大。交通标志检测系统需要具有强大的泛化能力来检测不同类型的标志。

由于传统卷积神经网络(Convolutional Neural Networks,CNNs)在细粒度特征提取方面的局限性,这些模型在检测小尺寸和远程交通标志时往往表现不佳。此外,自动驾驶车辆配备的嵌入式计算设备有限。尽管这些模型具有很高的检测准确性,但由于其复杂结构和大量参数,这些模型在资源受限的嵌入式系统上难以高效运行。研究行人已经开始关注通过模型压缩和特征增强来提高检测性能。然而,在提高效率的同时保持检测准确性仍然是一项具有挑战性的任务。因此,在自动驾驶领域,如何设计一种既高效又准确的交通标志检测模型,以在有限计算资源下实现这一点,已经成为一个亟待解决的问题。因此,利用有限计算资源在自动驾驶中实现高效准确的交通标志检测是一个紧迫的问题。

为了应对这些问题,作者提出了一种高效的交通标志检测算法YOLO-PPA。在本文中,作者将并行化patch aware注意力(PPA[8])机制引入传统的YOLO架构。PPA采用多分支特征提取策略,有效地增强了远距离交通标志的特征提取能力。此外,作者在原始C2F模块中引入了部分卷积(PConv[9]),以减少模型参数的数量,提高推理速度,同时不影响模型准确性。此外,针对交通标志类别分布不均匀的问题,作者在模型训练中采用APLoss[10],以提高模型的分类准确性。作者在GTSDB数据集上进行了比较实验和消融分析。实验结果表明,所提出的YOLO-PPA在[email protected]上的准确率为93.2%。与原始YOLOv8n相比,准确率提高了7.5%,推理速度提高了11.2%。综合实验分析证明了所提出方法的有效性。

本文的主要贡献可以总结如下:

(1)作者对YOLOv8n进行了优化,并提出了一个新的轻量级交通标志检测模型YOLO-PPA。YOLO-PPA在原始特征融合模块C2F中引入了部分卷积(PConv),在不降低准确率的情况下,提高了模型的推理效率。此外,作者引入了并行化patch aware注意力(PPA)机制。通过优化多分支特征融合策略,有效地增强了远距离交通标志的特征提取能力。

(2)为了解决交通标志类别分布不均匀的问题,作者在检测Head的分类分支上引入了APLoss[10]。作者将分类任务优化为类别标签置信度的排序任务,APLoss模型明确地表示了样本之间的关系,从而减少了正负样本比例的敏感性。

(3)作者在GTSDB数据集上进行了全面的比较实验和消融分析。实验结果表明,所提出的YOLO-PPA在推理速度、模型参数数量和检测准确性方面均优于原始YOLOv8n。所展示的改进证明了YOLO-PPA的有效性和实用性。

本文的其余部分安排如下:第二章是本文的方法论部分。本节详细描述了所提出的算法,包括YOLO-PPA的整体结构、PPA机制、PConv高效C2F模块结构和APLoss的实现。第四章呈现了实验结果和分析。作者在GTSDB数据集上比较了不同模型的性能,并讨论了检测性能的改进。第五章总结了本文的研究工作,并提出了未来的研究方向。

2 Methodology

随着深度学习的发展,神经网络已成为解决各种复杂机器学习问题的首选方法。其中,卷积神经网络(Convolutional Neural Network, CNN)在图像分类和目标检测等领域取得了显著的进展。本文提出了一种基于深度自注意力机制的CNN模型,用于图像分类任务。该模型使用深度自注意力模块(DA)来捕捉图像中的全局上下文信息,从而提高模型的性能。此外,该模型还引入了一种注意力权重机制,用于动态调整不同卷积层的权重,以实现有效的特征学习和降维。实验结果表明,该方案具有良好的分类性能和鲁棒性,能够有效地解决图像分类问题。

Overall Structure

图1中的YOLO-PPA是YOLOv8n的改进版。YOLO-PPA可以划分为四个部分:输入、backbone、neck和head。模型的输入是大小为640×640×3的三个通道图像被重新缩放。







请到「今天看啥」查看全文