本发明属于老鼠目标检测的,具体涉及基于自适应掩码的老鼠目标检测方法、系统及存储介质。
背景技术:
1、随着国民经济的持续发展,加快推动城市化建设的进程,提高城市发展质量,从而保障和完善国民民生。其中,食品安全是民生的根本,在快节奏时代的背景下,人们追求高速、高效的生活,激励了“外卖”、“餐馆堂食”等家外餐饮方式的发展,但各种餐饮商店食品加工卫生安全层次不齐,如鼠患、未穿着卫生服装、垃圾堆放等问题,所以如何高效地监管餐饮商店加工流程成为了许多人关注的问题。
2、目前,许多餐饮店安装了监控摄像头监管卫生安全,但老鼠在监控图像中像素点占比小,属于小目标,背景像素信息影响较大,而且餐饮店种类繁多,背景内容就很加复杂,而且老鼠身体较为灵活,因此很难将老鼠小目标从监控图像中剥离出来。近几年,已有的老鼠检测方法可以分为基于目标检测技术的方法和基于目标分割技术的方法,前者是利用通用目标检测技术进行目标定位和识别,因该技术是基于通用目标构建的方法,所以不能较好的适用于老鼠目标的形貌。而后者是利用图像分割技术对老鼠目标所在的像素点进行分类,然后将目标类别的像素点组成最大的连通区域,达到前景识别的目的,但餐饮店安装摄像头的品牌、方式和距离都不一样,导致部分图像分辨率低,目标轮廓模糊,降低分割精度,从而致使该方法在监控视频下效果不太满意。
3、现有的专门用于老鼠检测的方法较少,大多数基于视觉算法的老鼠目标检测方法对复杂背景的泛化性较差,在形状多变、尺度多变的老鼠目标的检测中都出现了不太满意的效果,大量的漏检、误检成为了监管道路上的阻碍。而基于外部传感器的方法存在设备成本高、过于依赖人工经验等问题,如红外传感器、紫外线探测仪等等。因此,急需提出一种泛化性好、抗干扰能力强的老鼠目标检测方案,解决模型对复杂背景易敏感的问题,使模型更拟合老鼠目标特性,从而提升检测性能。
技术实现思路
1、本发明的目的在于提供基于自适应掩码的老鼠目标检测方法、系统及存储介质,旨在解决上述的问题。
2、本发明主要通过以下技术方案实现:
3、基于自适应掩码的老鼠目标检测方法,包括以下步骤:
4、步骤s1:从监控视频中筛选出包含老鼠的图像,人工标注出定位框和类别信息,并分成训练集和测试集;
5、步骤s2:基于训练集训练检测模型;
6、步骤s21:将图像输入主干网络,提取不同尺度、不同语义的特征信息;
7、步骤s22:将特征信息分别输入并行的transformer解码器和像素解码器,以自适应生成掩码图,用于后续采样点选择;在像素解码器中,针对主干网络提取的不同的层次性特征信息,首先,通过可变形稀疏注意力模块添加可变形偏移特性;然后,通过卷积组合块加深模型的深度和改变特征维度;最后,由多尺度融合模块采用特征相加的融合方式,从下至上进行特征融合,并输出各层级的特征信息;
8、步骤s23:基于特征采样点构建变形解码器,进行特征细化增强;变形解码器对应多尺度融合模块输出的若干个层级的特征信息设置若干个从前至后依次连接的掩码注意力模块,所述transformer解码器的输出与多尺度融合模块输出的第一层级的特征信息f1'经过特征相乘层处理后生成掩码图,掩码图分别输入至若干个掩码注意力模块;首个掩码注意力模块的输入还包括可学习的查询变量,若干个掩码注意力模块同时联合多尺度融合模块输出的各层级的特征信息,最终筛选出最优采样点矩阵,并与多尺度融合模块输出的第一层级的特征信息f1'结合生成最强的特征信息,用于后续定位识别;
9、步骤s24:最后基于检测器进行分类识别和定位回归;
10、步骤s3:基于测试集测试步骤s2中训练后的检测模型的性能,得到性能最优的检测模型,用于检测监控图像中的老鼠目标。
11、为了更好地实现本发明,进一步地,所述步骤s22中,在添加可变形偏移特性时,包括以下步骤:
12、步骤a1:将输入的层次性特征分别输入第一支路和第二支路;
13、步骤a2:在第一支路中,首先,利用可变形卷积层在层次性特征的像素级方向上添加可变形偏移特征,动态调整模型感受野的大小,自适应地拟合目标的形貌,然后,进行特征稀疏化,最后,利用特征上采样层恢复信息的分辨率,保持第一支路和第二支路信息的分辨率一致,得到目标内容特征信息v、关键特征信息k;
14、步骤a3:在第二支路中,投影处理特征,将高维度的特征信息投影至低维度空间,压缩全局信息,得到全局目标查询特征信息q;
15、步骤a4:最后,通过多头自注意力模块处理目标内容特征信息v、关键特征信息k和全局目标查询特征信息q,强化信息的相关性。
16、为了更好地实现本发明,进一步地,所述步骤a4中,多头自注意力模块的特征映射关系如下:
17、
18、其中:multiheadatten()为多头自注意力模块的特征映射函数;
19、 x为待处理的特征信息;
20、 z q为查询特征信息;
21、 q为查询信息的索引;
22、 k为关键特征信息的索引;
23、 m为目前处理头数的索引;
24、 m为多头自注意力模块的头数;
25、 ω k为所有关键信息的集合;
26、 a mqk为第m个头自注意力的值;
27、 d k为特征维度;
28、kt为关键特征信息k的转置;
29、 w m表示对大括号中的结果进行线性变化。
30、为了更好地实现本发明,进一步地,所述步骤s2中,检测模型的损失函数包括掩码分类损失函数、位置回归损失函数和分类损失函数;所述掩码分类损失函数包括二值交叉熵损失函数和系数差异损失函数,用于计算生成的掩码图与分割图之间的损失;所述位置回归损失函数和分类损失函数分别为平滑l1损失函数和焦点分类损失函数。
31、为了更好地实现本发明,进一步地,所述步骤s2中,所述检测模型的主干网络利用已有的模型参数进行预训练,检测模型的其他部分采用随机的方式初始化权重参数,不断迭代更新参数,直至训练迭代次数达到最大迭代数,中止训练。
32、本发明主要通过以下技术方案实现:
33、基于自适应掩码的老鼠目标检测系统,基于上述的方法进行,包括训练模块、检测模块和测试模块;所述训练模块用于基于训练集训练检测模块,所述测试模块用于基于测试集测试训练后的检测模块并得到性能最优的检测模块,用于检测监控图像中的老鼠目标;
34、所述检测模块包括从前至后依次设置的主干网络、并行解码器、基于特征采样点构建的变形解码器以及检测器;所述并行解码器包括并列设置的像素解码器和transformer解码器,所述像素解码器包括若干个并列的处理支路和与处理支路连接的多尺度融合模块,处理支路上从前至后依次设置有可变形稀疏注意力模块、卷积组合块;所述变形解码器包括若干个从前至后依次连接的掩码注意力模块以及卷积组合块、特征相乘层和特征相加层;
35、所述transformer解码器和多尺度融合模块分别通过特征相乘层与变形解码器连接,用于实现将transformer解码器的输出和多尺度融合模块输出的第一层级的特征信息f1'经过特征相乘层处理后生成掩码图;所述掩码图分别输入至每个掩码注意力模块,所述多尺度融合模块输出的第一层级的特征信息f1'分别输出至变形解码器的首个掩码注意力模块以及特征相乘层与特征相加层,首个掩码注意力模块的输入还包括可学习的查询变量,尾部的掩码注意力模块通过卷积组合块和特征相乘层与特征相加层连接。
36、为了更好地实现本发明,进一步地,所述掩码注意力模块包括从前至后依次设置的第一特征相乘层、第一特征相加层、sigmoid函数层、第二特征相乘层、第二特征相加层、卷积组织块、全局平均池化层、多层感知机;所述第一特征相乘层的第一输入端通过全局平均池化层与多层感知机和多尺度融合模块连接,且第一特征相乘层的第二输入端通过全局平均池化层与多层感知机和可学习的查询变量或者前一个掩码注意力模块的输出端连接;与第一特征相乘层的第二输入端连接的多层感知机的输出端分别与第二特征相乘层、第二特征相加层连接,所述第一特征相加层的输入还包括掩码图。
37、为了更好地实现本发明,进一步地,所述像素解码器包括4个并列的处理支路,所述多尺度融合模块分别对应输出第一层级的特征信息f1'-第四层级的特征信息f4',所述变形解码器包括4个从前至后依次连接的掩码注意力模块。
38、为了更好地实现本发明,进一步地,所述可变形稀疏注意力模块包括并列的第一支路和第二支路以及多头自注意力模块,所述第一支路上从前至后依次设置有第一可变形卷积层、第二可变形卷积层、特征稀疏化模块和特征上采样层;所述第二支路上从前至后依次设置有全局平均池化层和多层感知机;所述特征上采样层用于输出目标内容特征信息v、关键特征信息k至多头自注意力模块,所述多层感知机用于输出全局目标查询特征信息q至多头自注意力模块;所述特征稀疏化模块包括从前至后依次设置的第一特征下采样层、第一卷积组合块、第二特征下采样层和第二卷积组合块。
39、一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述的方法。
40、本发明的有益效果如下:
41、(1)本发明通过可变形稀疏注意力模块添加可变形偏移特性,在像素级方向上添加可变形偏移特征,可以在模型学习过程中动态地调整模型感受野的大小,自适应地拟合目标的形貌;
42、(2)本发明将主干网络提取的特征信息分别输入并行的transformer解码器和像素解码器自适应生成掩码图,用于后续采样点选择,变形解码器利用掩码注意力模块结合特征的冗余性,引入掩码图进行采样点选择,大大提高了特征点的利用率,减少了模型的计算量,具有较好的实用性。
43、(3)本发明通过添加可变形偏移特性,在特征点方向上增强模型的目标形状不变性,能使模型更好地拟合老鼠多变的形貌,本发明可以动态调整感受野,使模型更加“贴合”老鼠目标的外形,并且构建特征采样点优化,减少模型对冗余信息的学习,提高特征信息的质量。本发明增强了模型的目标形状不变性,提升模型去冗余信息的能力,一定程度的优化了定位和识别,具有较好的实用性。
1.基于自适应掩码的老鼠目标检测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的基于自适应掩码的老鼠目标检测方法,其特征在于,所述步骤s22中,在添加可变形偏移特性时,包括以下步骤:
3.根据权利要求2所述的基于自适应掩码的老鼠目标检测方法,其特征在于,所述步骤a4中,多头自注意力模块的特征映射关系如下:
4.根据权利要求1所述的基于自适应掩码的老鼠目标检测方法,其特征在于,所述步骤s2中,检测模型的损失函数包括掩码分类损失函数、位置回归损失函数和分类损失函数;所述掩码分类损失函数包括二值交叉熵损失函数和系数差异损失函数,用于计算生成的掩码图与分割图之间的损失;所述位置回归损失函数和分类损失函数分别为平滑l1损失函数和焦点分类损失函数。
5.根据权利要求1所述的基于自适应掩码的老鼠目标检测方法,其特征在于,所述步骤s2中,所述检测模型的主干网络利用已有的模型参数进行预训练,检测模型的其他部分采用随机的方式初始化权重参数,不断迭代更新参数,直至训练迭代次数达到最大迭代数,中止训练。
6.基于自适应掩码的老鼠目标检测系统,基于权利要求1-5任一项所述的基于自适应掩码的老鼠目标检测方法进行,其特征在于,包括训练模块、检测模块和测试模块;所述训练模块用于基于训练集训练检测模块,所述测试模块用于基于测试集测试训练后的检测模块并得到性能最优的检测模块,用于检测监控图像中的老鼠目标;
7.根据权利要求6所述的基于自适应掩码的老鼠目标检测系统,其特征在于,所述掩码注意力模块包括从前至后依次设置的第一特征相乘层、第一特征相加层、sigmoid函数层、第二特征相乘层、第二特征相加层、卷积组织块、全局平均池化层、多层感知机;所述第一特征相乘层的第一输入端通过全局平均池化层与多层感知机和多尺度融合模块连接,且第一特征相乘层的第二输入端通过全局平均池化层与多层感知机和可学习的查询变量或者前一个掩码注意力模块的输出端连接;与第一特征相乘层的第二输入端连接的多层感知机的输出端分别与第二特征相乘层、第二特征相加层连接,所述第一特征相加层的输入还包括掩码图。
8.根据权利要求6或7所述的基于自适应掩码的老鼠目标检测系统,其特征在于,所述像素解码器包括4个并列的处理支路,所述多尺度融合模块分别对应输出第一层级的特征信息f1'-第四层级的特征信息f4',所述变形解码器包括4个从前至后依次连接的掩码注意力模块。
9.根据权利要求6所述的基于自适应掩码的老鼠目标检测系统,其特征在于,所述可变形稀疏注意力模块包括并列的第一支路和第二支路以及多头自注意力模块,所述第一支路上从前至后依次设置有第一可变形卷积层、第二可变形卷积层、特征稀疏化模块和特征上采样层;所述第二支路上从前至后依次设置有全局平均池化层和多层感知机;所述特征上采样层用于输出目标内容特征信息v、关键特征信息k至多头自注意力模块,所述多层感知机用于输出全局目标查询特征信息q至多头自注意力模块;所述特征稀疏化模块包括从前至后依次设置的第一特征下采样层、第一卷积组合块、第二特征下采样层和第二卷积组合块。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-5任一项所述的基于自适应掩码的老鼠目标检测方法。