基于大数据学习的水轮机空化声信号辨识方法与流程

专利2022-05-09  16


本发明涉及故障识别预警领域,尤其是涉及一种基于大数据和人工智能实现的水轮机组空化声信号辨识方法。



背景技术:

水电是全球能源战略的重要组成部分。在可再生资源中,它的发电量最高,占世界总发电量的16-17%,约占世界可再生电力的80%。水轮发电机组是水电站的核心设备,机组的稳定运行对于避免安全隐患、提高发电企业的经济效益具有重大意义。空化是水力机械内部常见的破坏现象,空化的存在会降低机组效率,增加机组振动和叶片磨损,导致水轮机组的工作寿命大幅降低,造成巨大的经济损失。

由平稳状态至产生空化发生通常具有一定的劣化过渡发展期。常规的设备空化状态检测技术通常需要复杂的物理模型参数计算或依赖于行业专家的经验知识,往往在监测部位数据超过故障报警阈值才进行诊断,因此无法在早期及时进行水轮机组初生空化预测诊断和调节维护,并且存在监测点少、缺乏系统性和综合性等问题。

随着以神经网络为代表的人工智能的兴起,原本负责的非线性参数和信号可以被神经网络进行很好地拟合,从而能够应用于故障早期诊断和预警中。但是如何利用神经网络对水轮机的空化信号进行辨识捕捉,是亟需解决的技术问题。



技术实现要素:

本发明的目的是解决现有技术中存在的问题,提供了一种基于大数据学习的水轮机空化声信号辨识方法,可以有效识别水轮机组初生空化的发生并及时进行预警与维护,减少设备不必要的停运,延长使用寿命。

为了实现上述目的,本发明采用以下技术方案:

一种基于大数据学习的水轮机空化声信号辨识方法,其步骤如下:

s1:通过待预警的水轮机组上布置的测点,实时获取每个测点最近的一段声信号时间序列数据,并将每个测点的声信号时间序列数据分割为多段归一化的声信号子序列,每个测点最新记录的一段声信号子序列作为实时信号子序列;

s2:将s1中得到的所有测点的声信号子序列输入自组织特征映射神经网络中,使声信号子序列按照对应的水轮机组运行工况聚为多个类簇,再根据每个类簇中声信号子序列的信号波动程度将各类簇分为稳定工况类簇和非稳定工况类簇;

s3:遍历所有测点的实时信号子序列在类簇中的分布情况,若稳定工况类簇中包含的实时信号子序列数量不低于最低数量阈值,则判断水轮机组已处于稳定工况并按照s4~s8进行初生空化预警,否则中断当前的初生空化预警流程;

s4:利用随机森林算法对稳定工况类簇中包含的实时信号子序列进行特征筛选,从中提取出能灵敏反应水轮机组运行工况变化的最优特征测点以及每个最优特征测点的最优特征子集;

s5:将每个最优特征测点的最优特征子集进行归一化后计算其信息熵,并以信息熵为输入,利用基于多层门控循环单元建立的健康状态预测模型预测水轮机组在健康状态下的未来趋势,得到每个最优特征测点在下一预测步长内声信号的预测信息熵;

s6:在所述下一预测步长内获取水轮机组上每个最优特征测点真实采集的声信号时间序列数据并计算其实际信息熵,由所述预测信息熵和实际信息熵计算每个最优特征测点的动态容差;

s7:基于水轮机组当前的出力工况,利用预先构建的映射网络预测得到水轮机组在所述下一预测步长内存在初生空化时的声信号信息熵,由所述预测信息熵和该存在初生空化时的声信号信息熵计算每个最优特征测点的动态容差警报阈值;

s8:基于阈值法对比所有最优特征测点的动态容差之和以及动态容差警报阈值之和,判断水轮机组是否存在初生空化现象,若存在则发出初生空化预警,否则不发出初生空化预警。

作为优选,所述s1中,将每个测点的声信号时间序列数据分割为多段声信号子序列的方法为:

s11:在每个测点的声信号时间序列数据上,利用固定大小的时间窗进行定步长滑动,每滑动一个步长从时间窗中提取一个声信号子序列;

s12:对s11中提取出的每一个声信号子序列进行归一化操作,得到最终输出的声信号子序列。

作为优选,所述s2的实现方法如下:

s21:将s1中得到的所有测点的声信号子序列作为自组织特征映射神经网络的输入层输入,经过无监督学习聚类使输入的声信号子序列被分到不同的类簇;

s22:对于s21中聚类得到的每个类簇,计算其中每一条声信号子序列内数据点的多个统计值,再计算同一个类簇中不同声信号子序列的每个统计值的偏差,若一个类簇对应的每个统计值的偏差均小于各自的偏差阈值,则将该类簇标记为稳定工况类簇,否则标记为非稳定工况类簇。

作为优选,所述的多个统计值包括声信号子序列内数据点的均值、最大值、最小值和中位数,所述偏差为方差。

作为优选,所述s4的实现方法如下:

s41:基于随机森林算法对所述稳定工况类簇中包含的每一条实时信号子序列进行第一扰动,并根据扰动前后的结果计算对应的每一个测点的特征重要度指标ψk,计算公式为:

式中:b为所述稳定工况类簇中包含的实时信号子序列总数,表示对第b条实时信号子序列进行第一扰动前决策树正确分类的袋外数据数目,为对第b条实时信号子序列进行第一扰动后决策树正确分类的袋外数据数目;

s42:以s41中得到的每一个测点的特征重要度指标为依据,从稳定工况类簇内所有实时信号子序列对应的测点中筛选出能灵敏反应水轮机组运行工况变化的最优特征测点;

s43:对于每一个最优特征测点,将其对应的实时信号子序列进行经验模态分解,得到等数量的特征子集,然后基于随机森林算法对每个特征子集进行第二扰动,并根据扰动前后的结果计算对应的每个特征子集的特征重要度指标ψk1,计算公式为:

式中:b'为每个最优特征测点的特征子集个数,表示对第b'个特征子集进行第二扰动前决策树正确分类的袋外数据数目,为对第b'个特征子集进行第二扰动后决策树正确分类的袋外数据数目;

s44:以s43中得到的每一个特征子集的特征重要度指标为依据,从每一个最优特征测点的特征子集中筛选出等数量的能灵敏反应水轮机组运行工况变化的最优特征子集。

作为优选,所述s5的实现方法如下:

s51:针对任意第p个最优特征测点,组合其最优特征子集形成长度为r的经特征提取后的信号序列x'=[xp,1,xp,2,...,xp,r,...,xp,r],对信号序列x'进行归一化处理,得到信号序列y'=[y'p,1,y'p,2,...,y'p,r],再对归一化处理后的信号序列y'计算信息熵yp,r

s52:构建并训练一个由多层门控循环单元组成的健康状态预测模型,其中的每一个门控循环单元对应于一个最优特征测点,用于预测水轮机组在不出现空化现象的健康状态下,对应最优特征测点处声信号序列信息熵的未来趋势;

s53:依次将每一个最优特征测点在s51中计算得到的信息熵yp,r输入健康状态预测模型中对应的门控循环单元,由门控循环单元输出对应最优特征测点在待预测的下一个时间步h内声信号的预测信息熵yp,h

作为优选,所述s6中,对于任意第p个最优特征测点而言,其动态容差δyp,h的计算公式为:

式中:为第p个最优特征测点在时间步h内真实采集的声信号时间序列数据的实际信息熵。

作为优选,所述s7的实现方法如下:

s71:基于自组织竞争网络建立测点声信号的信息熵与水轮机组在不同出力工况下空化发生状态的多维映射网络;

s72:确定水轮机组当前的出力工况,然后利用所述多维映射网络预测水轮机组中最优特征测点在时间步h内存在初生空化时的声信号信息熵

s73:根据每一个最优特征测点的声信号信息熵和预测信息熵yp,h计算动态容差警报阈值,计算公式为:

作为优选,所述s8中,通过堆叠面积图分析法进行对比分析。

作为优选,所述水轮机组在运行过程中,按照设定的步长间隔不断迭代执行s1~s8的流程。

相对于现有技术而言,本发明具有如下有益效果:

本发明基于经过大数据训练后的som神经网络和门控循环单元gru,实现了对水轮机组在稳定健康工况下的声信号进行实时检测,通过提取其状态特征,能够提前预测输出未来短时稳定工况信息,将预测信息与真实信息对比后即可及时发现运行中水电设备初生空化的发生。本发明能够降低水轮机组维修的盲目性,提高机组的安全运行能力以及电力系统的供电可靠性。

附图说明

图1是本发明的水轮机空化声信号辨识方法步骤示意图。

图2是本发明的空化预警流程图。

图3是多测点动态容差堆叠面积图。

图4是空化系数-相对效率(σ-η')曲线图。

图5是总体动态容差的变化曲线图。

具体实施方式

下面结合附图与具体实施例对本发明做进一步的描述。

本发明中基于水轮机组在出现空化现象时会发出异常声信号的特点,通过监测水轮发电机组不同测点位置的声信号,来实现非侵入式地初生空化实时预警。本发明采用的方案大致流程为:首先进行声信号数据预处理,使用自组织特征映射(self-organizingmaps,som)神经网络进行聚类分析,准确识别水轮机组的运行状态,并引入随机森林算法针对稳定状态进行特征选择,提取具有极强针对性的特征信号,使用门控循环单元(gru)对水轮机组各个监测点的未来振动发展状况进行预测,建立动态容差模型,实时连续地比较实际数据与预测数据的动态差异,通过耦合多个测点的实际偏离差距,监测水轮发电机组是否出现初生空化趋势,及时发现运行中水电设备的空化情况,从而合理地进行维护措施。下面对本发明的具体实现步骤进行展开叙述,以便于理解。

如图1所示,在本发明的一个较佳实施例中,提供了一种基于大数据学习的水轮机空化声信号辨识方法,其步骤如s1~s8所示。整个水轮机空化声信号辨识从而实现空化预警的基本流程可参见图2所示。下面对各步骤进行具体描述。

s1:通过待预警的水轮机组上布置的测点,实时获取每个测点最近的一段声信号时间序列数据,并将每个测点的声信号时间序列数据分割为多段归一化的声信号子序列,每个测点最新记录的一段声信号子序列作为实时信号子序列。

需注意的是,待预警的水轮机组上的声信号测点需提前布置,具体的布置位置可根据专家经验进行确定。在水轮机组运行过程中,每个测点位置需要通过传感器按照设定的采样频率不间断地获取水轮机组发出的声信号,并将其以时间序列的形式进行存储,由此形成海量的时间数据。而且在水轮机组在运行过程中,初生空化预警流程是按照设定的步长间隔不断迭代的,即每过一定的步长间隔就对新产生的数据进行一轮分析,从而实现初生空化预警,及时从声信号中发现空化现象的征兆。因此,在每一轮初生空化预警中,对于每个测点获取的声信号时间序列数据应当是包含了最新记录数据的。

在本实施例中,可以通过设置时间窗的方式,将每个测点的声信号时间序列数据分割为多段声信号子序列,具体方法如下:

s11:在每个测点的声信号时间序列数据上,利用固定大小的时间窗进行定步长滑动,每滑动一个步长从时间窗中提取一个声信号子序列。

假设任意第i个测点的声信号时间序列数据记为xi=[xi,1,xi,2,...,xi,m,...,xi,m],m代表声信号时间序列数据的长度,xi,m表示第i个测点的声信号时间序列数据中的第m个采样点数据,i=1,2,3,……,i,i代表水轮机组上的测点总数。在对xi进行分割提取时,可以1个长度为w的时间窗口按照步长k滑动,第1个步长得到第1个声信号子序列θ1=[xi,1,xi,2,...,xi,w],依次类推,即可形成一系列声信号子序列组成的样本数据集φ=<θ1,θ2,...,θc>,c表示一条声信号时间序列数据被提取出的声信号子序列总数。

每个测点中最新记录的一段声信号子序列θc记为实时信号子序列,这一段序列后续将作为空化预警的基础。

s12:对s11中提取出的每一个声信号子序列θj进行归一化操作,j=1,……,c,得到最终输出的声信号子序列θ'j,归一化可采用l1范数进行,公式如下:

式中:表示矩阵的范数。

由此上述样本数据集φ被归一化为φ'=<θ'1,θ'2,...,θ'c>,θ'c即为归一化后的声信号子序列,参与后续的预警流程。

水轮机组在启动后工况存在一定的非稳定时段,随后工况逐渐趋于稳定,因此上述声信号子序列提取的目的是形成水轮机组运行过程中不同时段的一系列样本,这些样本代表了不同工况状态下的声信号数据变化情况。而本发明中要预警的初生空化是发生在工况稳定之后的后续阶段,因此需要首先识别出水轮机组是否已进入稳定工况。该识别功能是通过后续的聚类来实现的。

s2:将s1中得到的所有测点的声信号子序列输入som神经网络中,使声信号子序列按照对应的水轮机组运行工况聚为多个类簇,再根据每个类簇中声信号子序列的信号波动程度将各类簇分为稳定工况类簇和非稳定工况类簇。

som作为一种聚类和高维可视化的无监督学习算法,是通过模拟人脑对信号处理的特点而发展起来的一种人工神经网络,其在聚类过程中会根据数据本身的特征进行分类,无需事先指定聚类类别。因此,本发明中利用som神经网络来进行无监督学习聚类。在本实施例中,上述s2的具体实现方法如下:

s21:将s1中得到的所有测点的声信号子序列作为自组织特征映射神经网络的输入层输入,经过无监督学习聚类使输入的声信号子序列被分到不同的类簇。

som算法属于现有技术,其大致流程分为初始化、竞争、合作、适应和迭代等步骤。下面对其实现过程进行简要叙述,但需要注意的是这仅仅是为了便于理解,而不作为对本发明的具体限制。som算法流程如下:

1)将上述归一化后的φ'=<θ'1,θ'2,...,θ'c>作为som神经网络的输入层。

2)将权值矢量用小的随机值进行初始化得到每个神经元的权值矢量wjj表示第j个神经元,j=1,2,3,……,j,j表示神经元总数。然后对权值矢量wj进行归一化,得到归一化的权值矢量w'j

3)设置初始学习速率η(t)为η(0);

4)计算每个神经元nj(t)节点的欧氏距离,选择距离最小的节点作为获胜节点;定义nj*(t)为获胜神经元,j*为获胜的神经元所在序号,t表示迭代次数(初始值为0);找到获胜神经元之后将获胜神经元记为1,非获胜神经元记为0,按照梯度下降法更新nj*(t)内所有节点的权值:

5)更新学习速率η(t)及获胜神经元,当迭代次数t超过设置的迭代次数k时结束循环,否则迭代次数t 1,并转到4)继续循环。

s22:对于s21中聚类得到的每个类簇,计算其中每一条声信号子序列内数据点的多个统计值,再计算同一个类簇中不同声信号子序列的每个统计值的偏差,若一个类簇对应的每个统计值的偏差均小于各自的偏差阈值,则将该类簇标记为稳定工况类簇,否则标记为非稳定工况类簇。

需说明的是,上述统计值可以是任何能够反应数据波动情况的统计量,例如均值、最大值、最小值、中位数,可以是其中的多个组合。而每一条声信号子序列都会基于自身序列中的采样点数据计算出相应的统计值,而这些统计值的偏差就可以反映一个类簇中不同声信号子序列的波动情况。在本实施例中,所采用的多个统计值包括声信号子序列内数据点的均值、最大值、最小值和中位数四种,而所谓的统计值的偏差即统计值之间的方差。举例而言,对于某一个类簇,假设其中具有q条声信号子序列,那么每一条声信号子序列分别计算均值、最大值、最小值和中位数,然后分别计算q条声信号子序列的均值的方差、q条声信号子序列的最大值的方差、q条声信号子序列的最小值的方差、q条声信号子序列的中位数的方差,假如这四个方差均小于四种统计值各自的方差阈值,那么就可以认为该类簇为稳定工况类簇,有任意一种统计值的方差超出了阈值就认为该类簇为非稳定工况类簇。另外,各统计值各自的方差阈值可以根据历史数据进行统计分析确定。

s3:遍历所有测点的实时信号子序列θ'c在类簇中的分布情况,若稳定工况类簇中包含的实时信号子序列数量θ'c不低于最低数量阈值,则判断水轮机组已处于稳定工况并按照s4~s8进行初生空化预警,否则表面水轮机组尚未处于稳定工况,此时进行空化预警是没有意义的,因此中断当前的初生空化预警流程,待新的数据产生后进行下一轮初生空化预警即可。

需注意的是,此处的最低数量阈值it需要根据测点的数量进行决定。如果测点总数i过少那么it应当尽量接近i,即应当尽可能使所有的测点均处于稳定工况状态,以满足后续的预测对于数据的需求。如果测点总数量i较多,那么it只要取i的一定比例即可。在本实施例中,设定如果测点总数i小于10个,则最低数量阈值it=i,如果测点总数i不小于10个,则最低数量阈值it=0.8i。

下面对本发明中初生空化预警流程中后续的s4~s8步骤具体实现形式进行展开描述。

s4:利用随机森林算法对稳定工况类簇中包含的实时信号子序列进行特征筛选,从中提取出能灵敏反应水轮机组运行工况变化的最优特征测点以及每个最优特征测点的最优特征子集。

随机森林(randomforest,简称rf)算法是一种高度灵活的机器学习算法,能够评估各个特征在分类问题上的重要性。前述稳定工况类簇中的实时信号子序列中并非所有的序列样本均对最终的水轮机空化预警具有较大影响,因此需要对其进行筛选,得到能灵敏反应水轮机组运行工况变化的特征,这分为两步,第一步是对测点的筛选,为了便于叙述,将第一步筛选得到的测点称为最优特征测点;第二步是对最优特征测点中特征子集的筛选,同样为了便于叙述,将第二步筛选得到的最优特征测点中的特征子集称为最优特征子集。

在本实施例中,上述步骤s4的具体实现方法如下:

s41:基于随机森林算法对前述稳定工况类簇中包含的每一条实时信号子序列进行扰动(为了以示区分,记为第一扰动,具体扰动做法参见随机森林算法,不再展开赘述),并根据扰动前后的结果计算对应的每一个测点的特征重要度指标ψk,计算公式为:

式中:b为随机森林训练样本个数即前述稳定工况类簇中包含的实时信号子序列总数,表示对第b条实时信号子序列进行第一扰动前决策树正确分类的袋外数据数目,为对第b条实时信号子序列进行第一扰动后决策树正确分类的袋外数据数目。

s42:稳定工况类簇内每一个实时信号子序列对应于一个测点,因此以s41中得到的每一个测点的特征重要度指标ψk为依据对测点进行重要度排序,ψk越小表示测点越重要,由此从稳定工况类簇内所有实时信号子序列对应的测点中筛选出部分最重要的测点,作为能灵敏反应水轮机组运行工况变化的最优特征测点。具体的筛选方式可参照随机森林算法,不再展开赘述。本步骤中提取出的最优特征测点个数记为p。

s43:对于每一个最优特征测点,将其对应的实时信号子序列进行经验模态(emd)分解,得到n个特征子集mf1~mfnn为特征子集总数,不同最优特征测点的n相同)。然后同样基于随机森林算法对每个特征子集进行扰动(为了以示区分,记为第二扰动,具体扰动做法参见随机森林算法,不再展开赘述),并根据扰动前后的结果计算对应的每个特征子集的特征重要度指标ψk1,计算公式为:

式中:b'为随机森林训练样本个数即每个最优特征测点的特征子集个数,表示对第b'个特征子集进行第二扰动前决策树正确分类的袋外数据数目,为对第b'个特征子集进行第二扰动后决策树正确分类的袋外数据数目。

s44:以s43中得到的每一个特征子集的特征重要度指标ψk1为依据,对特征子集进行重要度排序,ψk1越小表示特征子集越重要,由此从每一个最优特征测点的所有特征子集中筛选出最重要的部分特征子集,从而作为能灵敏反应水轮机组运行工况变化的最优特征子集。需注意,不同最优测点筛选出的最优特征子集中特征子集数量应当相等。具体的筛选方式可参照随机森林算法,不再展开赘述。

s5:将每个最优特征测点的最优特征子集进行归一化后计算其信息熵,并以信息熵为输入,利用基于多层门控循环单元(gaterecurrentunit,gru)建立的健康状态预测模型预测水轮机组在健康状态下的未来趋势,得到每个最优特征测点在下一预测步长内声信号的预测信息熵。

在本实施例中,上述步骤s5的实现方法如下:

s51:针对任意第p个最优特征测点,组合其最优特征子集形成长度为r的经特征提取后的信号序列x'=[xp,1,xp,2,...,xp,r,...,xp,r],对信号序列x'进行归一化处理,得到信号序列y'=[y'p,1,y'p,2,...,y'p,r],再对归一化处理后的信号序列y'计算信息熵yp,r

s52:构建并训练一个由多层gru组成的健康状态预测模型,其中的每一个gru对应于一个最优特征测点,用于预测水轮机组在不出现空化现象的健康状态下,对应最优特征测点处声信号序列信息熵的未来趋势;

s53:依次将每一个最优特征测点在s51中计算得到的信息熵yp,r输入健康状态预测模型中对应的gru,由gru输出对应最优特征测点在待预测的下一个时间步h内声信号的预测信息熵yp,h

gru是循环神经网络(recurrentneuralnetwork,rnn)的一种,是为了解决长期记忆和反向传播中的梯度等问题而提出来的。gru模型中具有两个门,分别是更新门和重置门。gru中的预测过程属于现有技术,为了便于理解,下面简述如下:

首先,将信息熵yp,r作为gru的初始化输入集进行输入,使用以下公式计算更新门ξh

其中yp,h-1保存的是前一个时间步(h-1)的数据信息,h表示待预测的下一个时间步,σ代表sigmoid激活函数,φ(ξ)u(ξ)分别表示输入到更新门ξh的权重矩阵和前一个时间步隐层到更新门ξh的权重矩阵。

然后,使用以下公式计算重置门γh

φ(γ)u(γ)分别表示输入到重置门γh的权重矩阵和前一个时间步(h-1)隐层到重置门γh的权重矩阵,在更新门和重置门中hyp,h-1均与权重矩阵相乘,将φ(γ)h u(γ)yp,h-1两部分相加后与sigmoid激活函数相乘,实现激活结果的归一化压缩。

再后,新的记忆内容y'p,h将使用重置门储存过去相关的信息,它的计算表达式为:

计算重置门γhu(γ)yp,h-1的hadamard乘积,从而确定所要保留与遗忘的以前信息。

最后,网络需要计算yp,h保存的时间步h的数据信息,该向量将保留当前单元的信息并传递到下一个单元中,使用更新门,它决定了当前记忆内容y'p,h和前一时间步yp,h-1中需要收集的信息是什么,yp,h计算表达式为:

需注意,上述的健康状态预测模型需要预先经过训练,使得其中每一个gru能够准确地基于信息熵yp,r预测下一时间步h的信息熵yp,h。训练时,采用adam算法自适应动态调整模型学习率,将平均绝对百分比误差最小作为目标损失函数,根据目标损失函数计算结果,检测gru模型精度是否达到要求,达到要求即可完成训练,否则继续进行寻优。

s6:在前述的下一预测步长h内,获取水轮机组上每个最优特征测点真实采集的声信号时间序列数据并计算其实际信息熵,由前述的预测信息熵yp,h和实际信息熵计算每个最优特征测点的动态容差δyp,h。对于任意第p个最优特征测点而言,其动态容差δyp,h的计算公式为:

式中:为第p个最优特征测点在时间步h内真实采集的声信号时间序列数据的实际信息熵。

需注意的是,上述预测信息熵yp,h实际上代表了假如水轮机组是没有发生空化而是一直处于健康运行工况下,预测步长h内正常的声信号对应的信息熵。而则代表了当前的水轮机组是实际运行工况下预测步长h内的声信号对应的信息熵,此时水轮机组是是否有初生空化是未知的,但是其是否有初生空化会影响并进而改变动态容差δyp,h。因此,后续可根据动态容差δyp,h进一步判断其是否存在初生空化。

s7:基于水轮机组当前的出力工况,利用预先构建的映射网络预测得到水轮机组在前述的下一预测步长h内存在初生空化时的声信号信息熵,由前述的预测信息熵yp,h和该存在初生空化时的声信号信息熵计算每个最优特征测点的动态容差警报阈值。由此,动态容差警报阈值实际代表了水轮机组是存在初生空化时其动态容差对应的值,基于这个阈值就可以反推水轮机组是否存在初生空化。

在本实施例中,上述步骤s7的具体实现方法如下:

s71:基于自组织竞争网络建立测点声信号的时频特征与水轮机组在不同出力工况下空化发生状态的多维映射网络,此处声信号的时频特征即其信息熵。该多维映射网络可以利用历史数据进行训练,使其能够根据水轮机组的出力工况准确预测对应的信息熵。

s72:确定水轮机组当前的出力工况,然后利用上述训练后的多维映射网络预测水轮机组中最优特征测点在时间步h内存在初生空化时的声信号信息熵

s73:根据每一个最优特征测点的声信号信息熵和预测信息熵yp,h计算动态容差警报阈值,计算公式为:

通过上述自适应耦合数据评估多个测点的动态容差以及动态容差警报阈值,即可用于后续判断设备是否存在初生空化现象。

s8:对比所有最优特征测点的动态容差之和以及动态容差警报阈值之和,可以判断水轮机组是否存在初生空化现象,判断规则是基于阈值法的规则,即:如果所有最优特征测点的动态容差之和超过了所有最优特征测点的动态容差警报阈值之和,那么若存在则发出初生空化预警,保存真实初生空化数据以便于后续分析,否则认为水轮机组处于正常运行状态没有发生初生空化,因此不发出初生空化预警。

由于本步骤中需要对多个最优特征测点的数据进行加和对比,因此为了便于分析和可视化展示,可以通过引入堆叠面积图分析法进行对比分析。如图3所示,作为示例,可将监测的各个测点在时间序列中的动态容差映射到二维坐标空间,累加各个测点的动态容差得出水轮机组设备的总体动态容差随时间的变化曲线,同样的将动态容差警报阈值也映射到二维坐标空间,累加各个测点的动态容差警报阈值得出水轮机组设备的总体动态容差警报阈值随时间的变化曲线。通过直观观察二维坐标空间中两条变化曲线即可完成判断。以图3中的5个测点为例,其在h=4的位置总体动态容差的曲线超过了总体动态容差警报阈值的曲线,表明此处出现了初生空化。

上述s1~s8的过程可视为一轮初生空化预警流程,当各测点出现新的数据后可继续进行下一轮的初生空化预警。

下面将上述s1~s8所示的水轮机空化声信号辨识方法应用于一个具体的实例中,以展示其技术效果。该方法在下述实例中的具体做法如前所述,不再赘述,下面主要展示其具体实现细节和技术效果。

实施例

本实例中,通过检测平台对轴流式水轮机最大水头最大输出工况下的空化过程进行了信号检测,空化通常发生在轴流式水轮机的转轮处,因此在转轮外壁叶片前缘、叶片中线、叶片后缘、尾水管入口处安装了4个测点获取信号的瞬态声信号,并实时记录形成用于进行预警的声信号序列数据。

水轮机相对效率η'定义如下式所示:

其中,ηmax为最大空化系数对应的效率值,η为测量效率值。

该工况下的试验的空化系数-相对效率(σ-η')曲线如图4所示,图中σ初生为初始空化系数,此时空化通过肉眼观测首次可见;σ临界是临界空化系数,此时效率下降超过1%。因此,本实例中以该工况下获得的声信号序列数据进行初生空化预警,判断本发明的方法是否能够对上述出现的空化现象做出灵敏地预警。

具体的初生空化预警流程如前述的s1~s8所述,其中采用som神经网络进行时间序列聚类,提取稳定工况运行数据时,由于本次实验仅设置了四个测点,因此直接进行特征子集的筛选,通过衡量特征子集的重要度指标,对特征子集进行排序,从而选取能够灵敏反应水轮机组工况变化的两个特征子集(记为特征子集1和特征子集2)作为最优特征子集,进而进行下一步分析。通过提取空化系数为0.6至1.5时各测点特征子集1和特征子集2的信息熵,并对空化系数为0.24至0.6时的各测点特征值信息熵进行预测,结果如表1所示

表1各测点的信息熵

最终通过上述的阈值法对4个测点的动态容差之和以及动态容差警报阈值之和进行对比,以判断设备是否存在初生空化现象。如图5所示,结果表明在初生空化时(σi=0.5)动态容差之和发生了明显激增现象,超过动态容差警报阈值之和,触发了空化预警提醒,与图4中一致。由此表明,本发明提供的初生空化预警方法能够通过声信号及时发现运行中水电设备的空化情况。

上述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。

转载请注明原文地址:https://doc.8miu.com/read-250139.html

最新回复(0)