一种基于改进的EMD和神经网络模型的异常数据检测方法与流程

专利2022-05-09 42

本发明属于通信技术领域，具体涉及一种基于改进的emd和神经网络模型的异常数据检测方法。

背景技术：

异常数据的发生位置及原因关系到系统运行的效果及修复的难易，所以通过为异常数据设计有效的检测方法可实现各种目标。

近年来，国内外学者针对异常数据检测开展了广泛的研究，提出了包括小波分析、盲源分离、经验模态分解等一系列信号的降噪处理方式，聚类、贝叶斯、随机森林等异常数据检测方法。其中小波分析需要根据不同的波形选择不同的小波基函数，选择不当则可能导致精度较差；盲源分离分离出的源信号幅值和排序具有不确定性；聚类对异常值较为敏感，随机森林噪声较大的情况下易产生过拟合现象。经验模态分解克服了传统包络分析中需要预先确定滤波器中心频带的难题，广泛应用于非线型、非平稳信号的分析，但是其存在模态混叠的现象。综上所述，以上方法对提取信号的特征变量均有不足。

因此有必要寻找一种新的方法来抑制噪声对采样信号的干扰且能准确提取出信号的特征变量，用于找到异常数据。

技术实现要素：

针对上述问题，本发明提供了基于emd和神经网络模型的异常数据检测方法，振动信号在提取时总会掺杂着人为或机械的噪声，噪声会影响信号的使用，甚至会导致检测结果产生误差。因此，对信号进行降噪处理对保证采样准确具有重要意义。本发明能够提高滚动轴承故障诊断的准确性和有效性，为解决滚动轴承故障诊断问题提供一种新的有效途径，可广泛应用于化工、冶金、电力、航空等领域的复杂机械系统故障诊断中。

本发明采用的技术方案是：

一种基于改进的emd和神经网络模型的异常数据检测方法，具体步骤如下：

步骤(1.1)、使用envelope函数在原始信号上画出包络线；

步骤(1.2)、将画好包络线的信号输入到改进的emd中提取出其特征变量，即imf分量；采用改进的emd提取特征变量时，将提取流程中的三次样条插值函数修改为fminbnd函数，包络函数采用envelope函数，简化提取流程；

步骤(1.3)、将提取出的特征变量输入到神经网络模型中，经过神经网络模型的三层筛选，与故障原因的频谱相匹配后，找出故障点及故障原因。

在步骤(1.2)中，依据数据自身的时间尺度特征进行信号分解；并将提取流程中的三次样条插值函数修改为简单的取极值fminbnd函数，包络函数修改为envelope函数。两个函数修改之后，运行出错概率降低。fminbnd函数与之前复杂的三次样条插值函数相比，运行时间更短，且在实际测试中增加了imf分量的准确性，能更好的还原出原始信号，避免了噪声点对信号的影响。

本发明方法与直接使用神经网络模型相比可以避免噪声对信号的影响，且可将庞大的数据只提取出3个imf分量，从而减少神经网络模型的工作量，避免噪声对神经网络模型检测的影响，提高神经网络模型的精确度。

本发明的有益效果是：

本发明提出一种基于改进emd和神经网络模型的异常数据检测方法，目的是使得通过改进的经验模态分解(empiricalmodedecomposition，emd)得到的imf(intrinsicmodefunction，imf)分量更加完整全面，且更能提现信号的特征，再输入到神经网络模型中，可大大提高精确度。改进的emd和神经网络模型的使用克服了常规经验模态分解存在的模态混叠问题，提取出的特征变量噪声点更少且更加准确，以及克服了神经网络模型存在过学习与欠学习导致误差较大的问题，检测出的异常数据准确率更高。检验证明相较于其他方法更加有效。

附图说明

图1是本发明方法的流程图；

图2是本发明中原始信号的时域和频域的图形示意图；

图3是使用小波变换的特征分量的时域波形图；

图4是使用改进emd方法的特征分量的时域波形图；

图5是使用小波变换的特征分量的频谱示意图；

图6是使用改进emd方法的特征分量的频谱示意图；

图7使用小波变换的特征分量的包络谱示意图；

图8是使用改进emd方法的特征分量的包络谱示意图。

具体实施方式

为了更清楚地说明本发明的技术方案，下面结合附图对本发明的技术方案做进一步的详细说明：

如图1所述；一种基于emd和神经网络模型的异常数据检测方法，具体步骤如下：

步骤(1.1)、使用envelope函数在原始信号上画出包络线。

步骤(1.2)、将画好包络线的信号输入到改进的emd提取出其特征变量，即imf分量；采用改进的emd提取特征变量时，将提取流程中的三次样条插值函数修改为简单的取极值fminbnd函数，包络函数采用envelope函数，简化提取流程。

在使用改进的emd提取特征变量时，使用envelope函数的具体方法是：避免噪声点的影响，画出的包络线贴近信号，满足imf分量的要求，减少改进emd的运行时间；

所述改进的emd依据数据自身的时间尺度特征进行信号分解；与建立在先验性的谐波基函数上的傅里叶分解和建立在小波基函数上的小波分解具有本质差别。

具体的，给定一个信号x(t)，其可以分解为有限个本征模函数，所分解出来的各imf分量包含了原信号的不同时间尺度的局部特征信号；通过筛选使得抽取的模函数更加符合使用需求；在提取imf分量时必须满足2个充要条件：第一个是极值点数和零点数最多相差1，第二个是上包络和下包络的均值必须等于零；

其具体操作过程如下：

(1)、使用fminbnd函数确定原始信号x(t)的所有极值点，使用envelope函数拟合出上下极值点的包络线，并计算上下包络线的平均值曲线m(t)；

(2)、在x(t)中减去包络的平均值曲线h(t)＝x(t)-m(t)，根据筛选条件判断h(t)是否为imf；

(3)、如果不满足筛选条件，则以h(t)代替x(t)，重复以上步骤直到h(t)满足筛选条件，则h(t)就是需要提取的imf分量；

(4)、每得到一阶imf，就从原信号中扣除它，重复以上步骤直到信号最后剩余部分rn就只是单调序列或者常值序列；

(5)、经过emd方法分解将原始信号x(t)分解成一系列imf以及剩余部分的线性叠加：

本发明将原始emd中的三次样条插值函数修改为fminbnd函数，从而找到更加精确的原始函数的极值点；使得提取的imf数量少且精确，imf分量在时域和频域的图像上显示平滑无噪点，减少emd的循环次数，减少噪声点对提取imf分量的影响；从而降低其提取难度，保持原始信号的特性；

使用envelope函数在分解后的信号上画出包络线，从而使得最终得到的imf分量更加精确。避免了对信号直接包络解调而出现的漏诊现象，有效地去除了原始信号中的噪声。

步骤(1.3)、最后将提取出的特征变量输入到神经网络模型中，经过神经网络模型的三层筛选，与故障原因的频谱相匹配后，找出故障点及故障原因。

具体的，神经网络的前馈意义在于每一层节点的输入仅来自前面一层节点的输出。对于输入信号，先前向传播到隐层节点，经过激活函数后，再把隐层节点的输出信息传播到输出节点，最后得到输出结果。

(1)输入层节点i(i＝1,2,...,n)，其输出oi等于输入xi，将变量值传送到第二层。

(2)隐层节点j(j＝1,2,...,p)，其输入ij，输出oj分别为：

oj＝f(ij)＝1/[1 exp(-ij)]

式中，ωji为隐层节点j与输入层节点i之间的权值，θj为隐层节点j的偏置，f为sigmoid函数，其表达式为：

f(x)＝1/[1 exp(-x)]

(3)输出层节点k(k＝1,2,...,m)，其输入ik，输出yk分别为：

yk＝f(ik)＝1/[1 exp(-ik)]

式中，ωkj为输入层节点k与隐层节点j之间的连接权值，θk为输出层节点k的偏置。

对于给定的训练样本(xp1,xp2,...,xpn)，p为样本数(p＝1,2,...,p)，网络输出e与训练目标之间的均方误差ep可表示为：

其中p为样本数，tpl为第p个样本的第l个输出单元的目标输出结果，ypl为第p个样本的第l个输出单元的网络运算结果。神经网络训练的过程包括网络内部的前向计算和误差的反向传播，其目的就是通过调整网络内部连接权值使网络输出误差最小。对于多层前馈网络中输入层与隐层之间、隐层与输出层之间连接权值利用神经算法调整。

采用不同方法提取出的3个imf特征变量在时域、频域和包络线上的表现如图3至图8所示，其中图3、图5、图7是使用小波变化的各谱图，图4、图6、图8是使用了改进emd方法的各谱图。

由图4、图6、图8可以明显看出，在使用了改进的emd后，图形更加平滑且包络图效果更好，无用点更少，提高了数据分析的精度，降低了后续数据处理分析的复杂度且神经网络模型的准确率提升。这证实了本发明提出方法的可行性，所提取出的imf包络谱更加精确，确实使得后续神经网络模型的处理更加快捷准确。

本发明避免了对信号直接包络解调而出现的漏诊现象，有效地去除了原始信号中的噪声，检测异常数据的精确度达94.8％。

由图4、图6、图8可以明显看出，在使用了改进emd和神经网络模型结合的方法后，图形更加平滑且包络线更贴近信号，噪声点更少，降低了噪声对数据的影响，提高了数据分析的精度；使用了更适合的envelope函数作为包络函数，降低了提取imf分量的工作量而且提高了imf分量的精度，降低了提取imf分量的要求，扩大了峭度系数和采样率选择范围，提高了数据分析处理的精度，可容易提取到准确的特征变量和平滑的包络线，减少了imf分量的数量，去除了无用点，降低了后续神经网络模型的复杂度，这对神经网络模型检测起到了良好的前端处理的作用，总体的准确率有所提升。这证实了本发明提出方法的可行性。

最后，应当理解的是，本发明中所述实施例仅用以说明本发明实施例的原则；其他的变形也可能属于本发明的范围；因此，作为示例而非限制，本发明实施例的替代配置可视为与本发明的教导一致；相应地，本发明的实施例不限于本发明明确介绍和描述的实施例。

技术特征：

1.一种基于改进的emd和神经网络模型的异常数据检测方法，其特征在于，具体步骤如下：

步骤(1.1)、使用envelope函数在原始信号上画出包络线；

步骤(1.2)、将画好包络线的信号输入到改进的emd中提取出其特征变量，即imf分量；采用改进的emd提取特征变量时，将提取流程中的三次样条插值函数修改为fminbnd函数，包络函数采用envelope函数；

步骤(1.3)、将提取出的特征变量输入到神经网络模型中，经过神经网络模型的三层筛选，与故障原因的频谱相匹配后，找出故障点及故障原因。

2.根据权利要求1所述的基于改进的emd和神经网络模型的异常数据检测方法，其特征在于，所述步骤(1.2)具体包括如下步骤：

(1)、使用fminbnd函数确定原始信号x(t)的所有极值点，使用envelope函数拟合出上下极值点的包络线，并计算上下包络线的平均值曲线m(t)；

(2)、在x(t)中减去包络的平均值曲线h(t)＝x(t)-m(t)，根据筛选条件判断h(t)是否为imf；所述筛选条件为：a.极值点数和零点数最多相差1，b.上包络和下包络的均值必须等于零；

(3)、如果不满足筛选条件，则以h(t)代替x(t)，重复以上步骤直到h(t)满足筛选条件，则h(t)就是需要提取的imf分量；

(4)、每得到一阶imf，就从原信号中扣除它，重复以上步骤直到信号最后剩余部分rn只是单调序列或者常值序列；

(5)、将原始信号x(t)分解成一系列imf以及剩余部分的线性叠加：

技术总结
本发明公开了一种基于改进经验模态分解(EMD)和神经网络模型的异常数据检测方法，属于通信技术领域。本发明方法具体包括如下步骤：1、使用envelope函数在原始信号上画出包络线；2、将画好包络线的信号输入到改进的EMD中提取出其特征变量，即IMF分量；采用改进的EMD提取特征变量时，将提取流程中的三次样条插值函数修改为fminbnd函数，包络函数采用envelope函数；3、将提取出的特征变量输入到神经网络模型中，经过神经网络模型的三层筛选，与故障原因的频谱相匹配后，找出故障点及故障原因。本发明提出的方法克服了经验模态分解对微弱故障特征不敏感的缺陷，增强了神经网络模型的精确度。

技术研发人员：朱敏;李创;吕巧玲;刘唐丁;龚亦昕;柴秋子;杨春节
受保护的技术使用者：杭州哲达科技股份有限公司
技术研发日：2021.04.13
技术公布日：2021.07.02

转载请注明原文地址:https://doc.8miu.com/read-350062.html

专利

最新回复(0)