基于局部敏感哈希算法的变压器潜在故障预测方法及系统与流程

专利2022-05-09  14


本发明涉及一种预测方法,具体涉及一种基于局部敏感哈希算法的变压器潜在故障预测方法及系统,属于变压器设备故障预测技术领域。



背景技术:

变压器是变电站的核心设备。变压器在长时间运转的过程中,受各方面因素的影响,不可避免的会出现各种故障。其中大部分故障的形成是一个隐蔽而缓慢的过程。当最终出现剧烈的故障表象时,设备已经损坏,需要耗费大量的人力物力进行维修。因此,如何对工作过程中的设备进行持续监测,提前发现潜在的故障征兆,及时进行人工干预避免故障发生,是变电站一直在研究的课题。

目前,大多数变电站在变压器故障预测方面,采用固定阈值判定法,此方法存在如下缺陷:

1)存在一定的局限性,只能实现单参数阈值判定,无法实现多参数联合判定。

2)阈值设定依赖于人员的经验,设定过于严苛则产生大量无效预警,设定过于宽松则预警产生时设备已经损坏。因此,迫切的需要一种新的方案解决上述技术问题。



技术实现要素:

本发明正是针对现有技术中存在的问题,提供一种基于局部敏感哈希算法的变压器潜在故障预测方法,本发明的目的在于提供一种适用于变压器的基于局部敏感哈希(localitysensitivehashing,lsh)算法的设备潜在故障预测方法及系统。通过大量历史样本数据的训练,构建预测模型,对设备的潜在故障征兆进行提前预测。

为了实现上述目的,本发明的技术方案如下,一种基于局部敏感哈希算法的变压器潜在故障预测方法,所述方法包括以下步骤:

步骤s1,导入用于训练的历史数据,并构建多维样本空间;

步骤s2,构建一系列的哈希函数族,用于把多维的样本数据点映射为一个整型向量;

步骤s3,从步骤s2中构建的哈希函数族中,随机选取m组哈希函数,每组由n个哈希函数组成,使用这些哈希函数对样本空间中的所有样本点进行处理,得到每个样本的映射向量;

步骤s4,在m组哈希函数中,把每一组中的具有相同映射向量的样本点划分为一个数据类;

步骤s5,遍历所有的数据类,把具有相同样本点的数据类进行合并;合并后所得到的每一个数据类,即代表设备正常运行过程中的一种工况。

步骤s6,记录合并后所有数据类的特征信息,并存储到数据库中;这里的特征信息包括但不限于,数据类的编号、所含样本点数量及时间戳、每个数据维度的最大值和最小值(这里指的是原始数据维度,而非映射后的数据)。

步骤s7,对于新接收的实时数据,遍历所有的数据类,并尝试划分到某个类中;

步骤s8,如果新的实时数据无法划分到任何一个类,则认为数据不符合正常运行工况,即判定数据代表某种潜在故障征兆。

其中,在步骤s1,导入用于训练的历史数据,并构建多维样本空间,具体如下:用于训练的历史数据必须是设备正常运行过程中产生的时序数据,不能有设备故障情况下的数据,历史数据中应包含两个或两个以上的物理参数(如:变压器油中氢气含量,水分,氧气含量,变压器铁芯电流,接地电流等),且这些参数之间从物理机理上应该是有相关性的,在构建多维样本空间时,同一个时刻的数据作为多维样本空间中的一个样本点。(每一个物理参数作为样本点的一个维度)。

应当理解,历史数据的导入方式有很多种,包括但不限于从时序数据库导入、从文件离线导入、从特定数据接口导入等。无论采用何种方式获取数据,均不应构成对本发明权利要求的影响,

其中,在步骤s2,构建一系列的哈希函数族,此处的哈希函数族的构建需要满足如下两个约束:

1)能够高效地把样本点映射为一个整型向量;

2)哈希函数族中所有函数设定不同的参数,但必须遵从统一的映射原则。

其中,在步骤s3,设使用通过p稳定分布构建hash函数族,则p取2时,定义的哈希函数族为:

其中,向量v是样本数据,向量a是由p稳定分布产生的与v维度相同的随机向量,b是(0,r)里的随机数,r是直线的分段长度,选取不同的a和b,构成多个哈希函数,从而构成哈希函数族;

从上述哈希函数族中,随机选取m组哈希函数(每组由n个哈希函数构成),记为

则样本点经过被映射成一个整型向量,这个向量便是这个样本点的标。

其中,在步骤s6,记录合并后所有数据类的特征信息,并存储到数据库,这里的特征信息包括数据类的编号、所含样本点数量及时间戳、每个数据维度的最大值和最小值。

一种基于局部敏感哈希算法的变压器设备潜在故障预测系统,所述系统包括实时数据采集装置,布置在变电站现场,用于从变压器设备上采集各类监测数据。

数据传输装置,布置在变电站现场,用于把采集装置采集到的各类数据发送到控制室或数据中心的时序数据库;

训练数据导入模块,用于向时序数据库中导入训练样本数据;

时序数据库,用于存储从数据传输装置发送来的设备实时数据,或用户导入的训练样本数据;

配置数据库,用于存储数据类及其特征信息;

数据处理及工况识别模块,使用局部敏感哈希算法对样本数据进行处理,得到一系列的数据类及其特征信息;

实时数据分析模块,用于判定每一批新接收的实时数据是否符合某一正常运行工况;

故障预警输出模块,对于不符合正常运行工况的数据,输出故障预警。

相对于现有技术,本发明具有如下优点,1)该方案采用多参数联合判定,解决单一参数判定的局限性;2)该方案采用历史数据训练,构建预测模型,减少对人员经验的依赖;3)该方案采用数据驱动的方式,在故障形成初期,精准发现潜在故障征兆,能够提前发现故障并预警。对于传统监测手段难以发现的隐性故障,具有更好的监测效果。

附图说明

图1是本发明一种基于局部敏感哈希(localitysensitivehashing,lsh)算法的变压器设备潜在故障预测方法的较佳实施例的流程示意图;

图2是本发明一种基于局部敏感哈希(localitysensitivehashing,lsh)算法的变压器设备潜在故障预测系统的较佳实施例的结构示意图。

具体实施方式

为了加深对本发明的理解,下面结合附图对本实施例做详细的说明。

实施例1:

如图1所示为本发明一种基于局部敏感哈希(localitysensitivehashing,lsh)算法的变压器设备潜在故障预测方法的较佳实施例的流程示意图,为了便于说明,仅示出了与本发明实施例相关的部分。

一种基于局部敏感哈希算法的变压器潜在故障预测方法,所述方法包括以下步骤:

步骤s1,导入用于训练的历史数据,并构建多维样本空间。

在本发明实施例中,用于训练的历史数据必须是设备正常运行过程中产生的时序数据,不能有设备故障情况下的数据。历史数据中应包含两个或两个以上的物理参数(如:变压器油中氢气含量,水分,氧气含量,变压器铁芯电流,接地电流等),且这些参数之间从物理机理上应该是有相关性的。在构建多维样本空间时,同一个时刻的数据作为多维样本空间中的一个样本点(每一个物理参数作为样本点的一个维度)。

应当理解,历史数据的导入方式有很多种,包括但不限于从时序数据库导入、从文件离线导入、从特定数据接口导入等。无论采用何种方式获取数据,均不应构成对本发明权利要求的影响。

步骤s2,构建一系列的哈希函数族,用于把多维的样本数据点映射为一个整型向量。

在本发明实施例中,认为的构建一系列具有统一映射规则的哈希函数族。这种哈希函数的意义是,将样本空间中的样本点映射为一个整型向量,以便于更好的处理。需要注意的是,此处的哈希函数族的构建需要满足如下两个约束:

3)能够高效地把样本点映射为一个整型向量。

4)哈希函数族中所有函数可以设定不同的参数,但必须遵从统一的映射原则。

应当理解,满足上述约束的构建哈希函数的方式有很多种。无论采用何种方式构建哈希函数,均不应构成对本发明权利要求的影响。

步骤s3,从步骤s2中构建的哈希函数族中,随机选取m组哈希函数(每组由n个哈希函数组成),使用这些哈希函数对样本空间中的所有样本点进行处理,得到每个样本的映射向量。

在本发明实施例中,假设我们使用通过p稳定分布构建hash函数族。则p取2时,定义的哈希函数族为:

其中,向量v是样本数据,向量a是由p稳定分布产生的与v维度相同的随机向量,b是(0,r)里的随机数,r是直线的分段长度。选取不同的a和b,构成多个哈希函数,从而构成哈希函数族。

从上述哈希函数族中,随机选取m组哈希函数(每组由n个哈希函数构成),可以记为

则样本点经过被映射成一个整型向量(x1,x2,…,xn),这个向量便是这个样本点的标识。

应当理解,哈希函数的构建方式和样本点的数据映射方式有很多种,无论采用何种方式,均不应构成对本发明权利要求的影响。

步骤s4,在m组哈希函数中,把每一组中的具有相同映射向量的样本点划分为一个数据类。

步骤s5,遍历所有的数据类,把具有相同样本点的数据类进行合并。合并后所得到的每一个数据类,即代表设备正常运行过程中的一种工况。

步骤s6,记录合并后所有数据类的特征信息,并存储到数据库。这里的特征信息包括但不限于,数据类的编号、所含样本点数量及时间戳、每个数据维度的最大值和最小值(这里指的是原始数据维度,而非映射后的数据)。

应当理解,用于存储分类结果的数据库有很多种,无论采用何种数据库,均不应构成对本发明权利要求的影响。

步骤s7,对于新接收的实时数据,遍历所有的数据类,并尝试划分到某个类中。

在本发明实施例中,合并后的每一个数据类即代表设备运行过程中的一种正常工况。对新的实时数据进行分类的过程,就是判定数据是否符合正常工况的过程。

步骤s8,如果新的实时数据无法划分到任何一个类,则认为数据不符合正常运行工况,即判定数据代表某种潜在故障征兆。

在本发明实施例中,对于实时数据是判定的准确性,即监测模型的准确性,依赖于历史数据是否完备,是否能够覆盖设备所有的正常运行工况。从理论上讲,设备的故障模式是不可穷举的,但是设备的正常运行工况是可以通过足够多的历史数据完全覆盖到的。

实施例2:

图2为本发明一种基于局部敏感哈希(localitysensitivehashing,lsh)算法的变压器设备潜在故障预测系统的较佳实施例的结构示意图,为了便于说明,仅示出了与本发明实施例相关的部份。其中:

实时数据采集装置s01,布置在变电站现场,用于从变压器设备上采集各类监测数据。

数据传输装置s02,布置在变电站现场,用于把采集装置采集到的各类数据发送到控制室或数据中心的时序数据库。

训练数据导入模块s03,用于向时序数据库中导入训练样本数据。

时序数据库s04,用于存储从数据传输装置发送来的设备实时数据,或用户导入的训练样本数据。

配置数据库s05,用于存储数据类及其特征信息。

数据处理及工况识别模块s06,使用局部敏感哈希算法对样本数据进行处理,得到一系列的数据类及其特征信息。

实时数据分析模块s07,用于判定每一批新接收的实时数据是否符合某一正常运行工况。

故障预警输出模块s08,对于不符合正常运行工况的数据,输出故障预警。

本方案的改进点在于,在传统固定阈值监测的基础上,增加了数据处理及工况识别模块,以及实时数据分析模块。其中,数据处理及工况识别模块通过对历史数据的分析,建立量化的数学模型。实时数据分析模块利用已有的数学模型进行分析和计算,找出故障潜在征兆。本方案相比于传统的固定阈值监测,其优势有两点:第一,支持多参数关联关系分析和建模;第二,能够发现故障的潜在征兆,对故障进行提前预警。特别是对一些隐性故障,其效果远远优于传统监测方式。

需要说明的是上述实施例,并非用来限定本发明的保护范围,在上述技术方案的基础上所作出的等同变换或替代均落入本发明权利要求所保护的范围。

转载请注明原文地址:https://doc.8miu.com/read-250207.html

最新回复(0)