一种基于卷积神经网络的车辆目标检测方法

专利2026-06-20  2


本发明涉及面向计算机视觉、目标检测和自动驾驶领域,具体地说是一种基于卷积神经网络的车辆目标检测方法。


背景技术:

1、目标检测,也叫目标识别,是计算机视觉领域的一个经典问题,其目的在于从输入的rgb图像中得到感兴趣目标的二维边界框和类别,其准确性和实时性是整个系统的一项重要特征。在真实场景下对车辆进行检测获取相关信息,有助于交通流量统计工作的展开,对停车场泊车调度系统和自动驾驶系统均有辅助作用。

2、传统的车辆检测算法主要针对静态背景,目标运动速度过慢时目标提取困难且计算量大,当目标的大小、形态发生改变时,识别准确率低。卷积神经网络(convolutionalneural network,cnns)具有很强的泛化能力,可以自动学习目标的深层语义特征,通过训练后还能对目标进行精准定位,研究其在目标检测上的应用非常有必要。


技术实现思路

1、针对现有技术的不足,本发明提供一种基于卷积神经网络的车辆目标检测方法,实现对输入图像的高精度目标检测,克服目前yolov3算法在小目标检测上的不足,可广泛用于城市智慧交通、停车场泊车系统。

2、本发明为实现上述目的所采用的技术方案是:一种基于卷积神经网络的车辆目标检测方法,包括以下步骤:

3、步骤1:获取rgb图像构建数据集用于卷积神经网络的训练,对数据集进行预处理得到n个锚框;

4、步骤2:将数据集中rgb图像通过darknet53网络提取特征;

5、步骤3:通过基于特征融合的soft-spp模块,将特征分别输入到池化核不同的池化层,在池化层采用softpool方式进行池化后将不同特征通道的特征串联;

6、步骤4:串联后的第一尺寸特征经过convolutional set卷积层进行上采样得到第二尺寸的特征图,第二尺寸特征图经convolutional set卷积层进行上采样得到第三尺寸的特征图;将第一尺寸的特征图、第二尺寸的特征图、第三尺寸的特征图分别与darknet53网络中第一尺寸的特征图、第二尺寸的特征图、第三尺寸的特征图进行串联后,分别输入至第一坐标注意力模块、第二坐标注意力模块、第三坐标注意力模块中,每个坐标注意力模块通过为每个特征通道分配不同的权重,将输入的特征图与权重根据特征通道相乘,得到输出特征;

7、步骤5:基于第一坐标注意力模块、第二坐标注意力模块、第三坐标注意力模块分别输出的第一尺寸、第二尺寸、第三尺寸的特征图,通过预处理的数据得到的n/3个锚框作为参考进行预测,分别在第一尺寸、第二尺寸、第三尺寸的特征图上得到预测框,完成通过由darknet53网络、soft-spp模块、convolutional set卷积层和坐标注意力模块构成的训练卷积神经网络进行训练,得到训练后的卷积神经网络;

8、步骤6:将含有车辆目标的图像输入至训练后的卷积神经网络,进行边界框和目标类别的预测。

9、所述对数据集进行预处理得到n个锚框,包括以下步骤:

10、获取kitti数据集中的标签数据,使用k-means算法对标签中的边界框尺寸进行聚类,求得n个锚框的尺寸,用于预测不同尺寸的目标;

11、所述标签数据包括目标及其真实框位置、类别。

12、所述基于特征融合的soft-spp模块,使用softpool代替maxpool进行池化:

13、

14、其中,ai为邻域r内的像素点,wi为第i个像素点权值,j代表该邻域内的像素点序号;

15、池化的输出值用求得的权值wi与相应位置像素点ai加权并求和得到:

16、

17、表示池化后的输出值,﹡表示点乘。

18、训练过程中,同时考虑边界框两个角点之间的距离和边界框的长宽比,采用衡量预测框和真实框接近程度的kiou函数:

19、

20、

21、

22、边界框损失函数为:

23、lbox=1-kiou

24、其中,h和w分别代表预测框的长和宽,hgt和wgt分别代表真实框的长和宽,ρ代表预测框与真实框对应点之间的欧式距离;k1和k2分别代表预测框的左上角点和右下角点;和分别代表真实框的左上角点和右下角点;c代表最小包围框ac的对角线长度;v用来度量长宽比的相似性,使得预测框和真实框的形状趋于相似;α是权重函数,iou表示预测框和真实框的交集面积与并集面积之比。

25、一种基于卷积神经网络的车辆目标检测系统,包括:

26、数据集构建模块,用于获取rgb图像构建数据集用于卷积神经网络的训练,对数据集进行预处理得到n个锚框;

27、特征提取模块,用于将数据集中rgb图像通过darknet53网络提取特征;

28、soft-spp模块,用于将特征分别输入到池化核不同的池化层,在池化层采用softpool方式进行池化后将不同特征通道的特征串联;

29、坐标注意力模块,用于串联后的第一尺寸特征经过convolutional set卷积层进行上采样得到第二尺寸的特征图,第二尺寸特征图经convolutional set卷积层进行上采样得到第三尺寸的特征图;将第一尺寸的特征图、第二尺寸的特征图、第三尺寸的特征图分别与darknet53网络中第一尺寸的特征图、第二尺寸的特征图、第三尺寸的特征图进行串联后,分别输入至第一坐标注意力模块、第二坐标注意力模块、第三坐标注意力模块中,每个坐标注意力模块通过为每个特征通道分配不同的权重,将输入的特征图与权重根据特征通道相乘,得到输出特征;

30、卷积神经网络模块,用于基于第一坐标注意力模块、第二坐标注意力模块、第三坐标注意力模块分别输出的第一尺寸、第二尺寸、第三尺寸的特征图,通过预处理的数据得到的n/3个锚框作为参考进行预测,分别在第一尺寸、第二尺寸、第三尺寸的特征图上得到预测框,完成通过由darknet53网络、soft-spp模块、convolutional set卷积层和坐标注意力模块构成的训练卷积神经网络进行训练,得到训练后的卷积神经网络;

31、目标检测模块,用于将含有车辆目标的图像输入至训练后的卷积神经网络,进行边界框和目标类别的预测。

32、一种基于卷积神经网络的车辆目标检测装置,包括存储器和处理器;所述存储器,用于存储计算机程序;所述处理器,用于当执行所述计算机程序时,实现所述的一种基于卷积神经网络的车辆目标检测方法。

33、一种计算机可读存储介质,所述存储介质上存储有计算机程序,当所述计算机程序被处理器执行时,实现所述的一种基于卷积神经网络的车辆目标检测方法。

34、本发明具有以下有益效果及优点:

35、本发明可有效地处理车辆目标检测问题,网络模型能够准确地学习到图像的显著特征,尤其是对小目标的学习情况有所改善,并最终给出车辆目标的定位信息和分类信息。



技术特征:

1.一种基于卷积神经网络的车辆目标检测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的一种基于卷积神经网络的车辆目标检测方法,其特征在于,所述对数据集进行预处理得到n个锚框,包括以下步骤:

3.根据权利要求1所述的一种基于卷积神经网络的车辆目标检测方法,其特征在于:所述基于特征融合的soft-spp模块,使用softpool代替maxpool进行池化:

4.根据权利要求1所述的一种基于卷积神经网络的车辆目标检测方法,其特征在于,训练过程中,同时考虑边界框两个角点之间的距离和边界框的长宽比,采用衡量预测框和真实框接近程度的kiou函数:

5.一种基于卷积神经网络的车辆目标检测系统,其特征在于,包括:

6.一种基于卷积神经网络的车辆目标检测装置,其特征在于,包括存储器和处理器;所述存储器,用于存储计算机程序;所述处理器,用于当执行所述计算机程序时,实现如权利要求1-5任一项所述的一种基于卷积神经网络的车辆目标检测方法。

7.一种计算机可读存储介质,其特征在于,所述存储介质上存储有计算机程序,当所述计算机程序被处理器执行时,实现如权利要求1-5任一项所述的一种基于卷积神经网络的车辆目标检测方法。


技术总结
本发明涉及一种基于卷积神经网络的车辆目标检测方法,包括:在YOLOv3算法的基础上,首先使用其主干网络DarkNet53进行特征提取,得到逐层的基础特征;将DarkNet53最后一层的特征输入Soft‑SPP模块进行特征融合;融合后的特征由1×1卷积层和3×3卷积层进一步提取特征,并将特征输入到坐标注意力模块中,进行通道间的权重调整;最终网络通过上采样输出三种不同尺度的特征图,使用预处理得到的基本锚框分别预测大、中、小三个尺度的目标,得到目标的二维包围框和类别信息。本发明提出的卷积神经网络模型相比YOLOv3模型取得了更佳的检测效果,不管是在主观视觉上还是在客观评价指标上均有明显改善,有效改善了车辆目标检测的漏检和误检现象,同时检测速度仍然能达到实时检测的要求。

技术研发人员:史泽林,赵怀慈,陈文玉,刘明第
受保护的技术使用者:中国科学院沈阳自动化研究所
技术研发日:
技术公布日:2024/6/26
转载请注明原文地址:https://doc.8miu.com/read-1830450.html

最新回复(0)