一种面向边缘计算的基于特征选择的图像分类方法与流程

专利2022-05-09  10


本发明属于面向边缘计算的图像特征选择与分类技术领域,涉及一种面向边缘计算的基于特征选择的图像分类方法,是一种基于卷积神经网络与模糊聚类选择特征的轻量化图像分类方法。



背景技术:

在图像分类领域,卷积神经网络由于其高效的特征提取能力而被广泛使用。卷积神经网络中的卷积层模仿了生物视觉皮层的结构,可以有效提取图像的深层次特征。但是卷积神经网络结构比较复杂,在诸如工业控制、边缘计算等很多领域的嵌入式部署与应用中存在一定的困难。为适应算力约束,轻量化方法可对卷积神经网络的网络结构进行约减。鉴于卷积神经网络所提取的部分特征在不同类别间的分布差异较小,对分类的贡献度不大,因此,通过特征选择,不但可以选出对分类贡献较大的特征,保证轻量化网络的分类精度,还可降低图像特征的维度,使得分类器网络规模下降,进而降低分类器出现过拟合的可能性。

特征选择算法是一类直接从已有特征中挑选出有助于分类的特征子集的特征降维方法。针对图像分类的特征选择问题,目前已有很多方法。一种常见的思路是从数据集本身出发,通过分析特征的内在属性,设计距离、信息度、关联度等特征内部评价指标,对特征进行评价和选择(hancere,xueb,zhangm.differentialevolutionforfilterfeatureselectionbasedoninformationtheoryandfeatureranking.knowledge-basedsystems,2018,140:103-119.)。此外,还有很多研究者将特征选择嵌入到学习器中,将特征选择问题表达为优化问题,通过在学习器的损失函数中添加正则化项,即特征权重矩阵范数的组合,从而选择出权重较高的特征(j.han,z.sun,h.hao.selectingfeaturesubsetwithsparsityandlowredundancyforunsupervisedlearning.knowledge-basedsystems.2015,86:210-223)。除了上述直接从已有特征中选择特征子集的算法外,还有很多研究者采用特征降维的方式,典型的算法包括主成分分析、因子分析、局部线性嵌入法等。这些方法挖掘数据的隐藏结构,将原有特征集映射到低维的特征空间,并使数据在低维空间中能最大程度保留原有的结构,降低了特征的维度。



技术实现要素:

本发明要解决的技术问题是:在采用卷积神经网络提取的图像特征基础上,采用模糊c均值聚类算法选出类间分布差异较大、对分类作用明显的图像特征,实现对分类器的轻量重构及较高精度的图像分类,为在边缘计算节点的部署实施打下基础。

本发明针对采用特征选择方法轻量化卷积神经网络图像分类器这一问题,考虑到分类器训练样本标签的存在,拟充分利用这些图像标签信息,采用针对各维图像特征的模糊聚类结果来描述各维图像特征在不同样本类别上的分布情况,并依据各维图像特征在类间分布差异的大小选择对分类贡献大的特征,实现分类器的轻量化和高精度的图像分类。

本发明的技术方案是:

一种面向边缘计算的基于特征选择的图像分类方法,具体步骤如下:

步骤(1)、训练过程和特征提取

卷积神经网络经过训练集训练后,利用卷积神经网络的卷积层和池化层获取训练集图像特征,设图像特征集合为x={x1,x2,...,xn},n为训练集样本的数量,卷积神经网络提取的每个图像特征的维度为f;令xd={xd1,xd2,...,xdn}为x中所有图像特征的第d维特征构成的集合,d=1,2,...,f;训练集图像的标签类别数为c,根据类别标签对xd进行划分:

其中,表示第t类图像在第d维特征上的特征集合,表示空集。

步骤(2)、使用模糊c均值算法进行聚类,并计算类间分布差异度

使用模糊c均值算法分别对进行聚类,过程如下:假设将聚为k类,上算法对应的两个聚类参数:v(t)={ν1,ν2,…,νk}为k个聚类中心,u(t)=[uij]k×n为隶属度矩阵,其中uij表示中某样本xj对第i个聚类中心的隶属度uij;算法的目标函数和约束条件如下:

式中,m为模糊加权参数。

采用拉格朗日乘子法,令偏导数为0时,解出uij、νi如下:

通过迭代式(4)和(5)得到聚类结果v(t)和u(t)

模糊c均值算法获得聚类中心和隶属度信息,聚类中心描述特征集中的位置,隶属度刻画出在每一图像类别上每维特征围绕k个聚类中心的聚集程度,利用聚类中心和隶属度得到各维特征在各类别上分布的描述。

基于模糊c均值算法得到的聚类中心和隶属度信息,计算各维度特征的类间分布差异度,定义第d维特征上类间分布差异度的度量为:

其中的计算方式为:

其中νi为的第i个聚类中心,νneighbor为其他子类l=1,2,...,c,l≠t中与νi之差绝对值最小的聚类中心,表示上所有样本对聚类中心νi的隶属度之和。

计算各维度图像特征的类间分布差异度,并按由大到小顺序排列,选取前z维特征作为特征选择的结果(类间分布差异度越大,分类贡献越大)。根据选出特征的维度重新设定softmax分类器的输入节点实现分类器的重构,并使用选出的特征对分类器进行训练。其中,重新设定softmax分类器,输入节点数为选出的特征维数z,输出节点数为图像的标签类别数c;z作为超参数,可根据测试集图像样本的分类结果调整其取值。

步骤(3)、待分类图像的分类

对于待分类的图像样本,使用训练好的卷积层和池化层提取其图像特征,并根据在训练集上执行步骤(1)和步骤(2)的特征选择结果,选取相应的特征送入重新设定softmax分类器,最终输出分类结果。

本发明的有益效果:本方法可以选出对分类贡献较高的特征参与图像分类,提高分类的精度。同时,本方法减少了图像特征的维度,相应降低了分类器网络的规模,实现了分类器的轻量化,为在边缘计算节点的部署实施打下了基础。

附图说明

图1是一种面向边缘计算的基于特征选择的图像分类方法的示意图。

具体实施方式

下面结合技术方案、附图和实例详细叙述本发明的具体实施方式。

本发明的流程如图1所示,该方法首先利用训练集图像样本训练卷积神经网络,之后利用卷积神经网络中训练好的卷积层和池化层,提取训练集图像特征。接着在训练集图像特征的每维特征上,采用模糊c均值算法,分别对每个类别图像对应的特征集合进行聚类,由聚类得到的参数(聚类中心和隶属度)计算每维特征的类间分布差异度,将其大小作为特征选择的依据,选出对分类贡献较高的特征来重构和训练softmax分类器。对于待分类的图像样本,利用卷积层和池化层提取其图像特征,并根据训练集特征的选择结果,选取待分类图像特征中相应维度的特征送入softmax分类器,得到的输出即为待分类图像的分类结果。

在本实施例中,使用到的图像来自公开数据集catsvsdogs,图像分为猫狗两类,具体实施方式如下:

首先,利用catsvsdogs的训练集图像样本训练卷积神经网络,并使用训练好的卷积层和池化层提取训练集图像特征,此时特征维度为2048维。依次选取所有图像特征的每一维特征构成特征集合,可表示为xd={xd1,xd2,...,xdn},d=1,2,...,f。根据训练集图像的类别标签将特征分成如式(1)所示的子集,使用模糊c均值算法(式(4)和式(5))对t=1,2,…c进行聚类。

利用模糊c均值算法得到的聚类中心和隶属度,根据式(6)、(7)计算当前维度图像特征的类间分布差异度。完成对所有维度图像特征类间分布差异度的计算后,将图像特征按类间分布差异度由大到小的顺序排序,并选取前z维特征作为特征选择结果。本实例中,根据验证集上的结果,当选取的特征为1200维时可获得最高的分类精度。

根据特征选择结果调整softmax分类器的输入节点数,实现分类器的重构,并对重构后的分类器进行训练。softmax分类器由一个输入层和一个输出层采用全连接的方式构成。本实施例中输入层包含1200个输入节点,输出层包含2个输出节点。

将catsvsdogs的测试集作为待分类的图像,用训练好卷积层和池化层对其进行特征提取,根据训练阶段的特征选择结果选取相应维度的特征作为softmax分类器的输入,最终输出即为分类结果。本实施例中,获得了95.53%的分类准确率,相比原始的卷积神经网络提升了1.63%,说明本方法可以选出对分类贡献较大的特征,提高网络的图像分类精度。

转载请注明原文地址:https://doc.8miu.com/read-250302.html

最新回复(0)