一种基于多架次飞行数据表征建模的飞行数据异常判读方法与流程

专利2022-05-09  72


本发明属于飞行器运行状态监测与评估领域,具体地,涉及一种基于多架次飞行数据表征建模的飞行数据异常判读方法。



背景技术:

面向飞行器的状态监测与评估技术可以有效地判断飞行器是否处于正常的工作状态,及时发现异常,保障飞行器的正常运行和飞行安全,提高其任务效率和维修保障效率,降低全寿命周期的运营成本。飞行数据记录了飞行器整个飞行过程的运行状态,飞行数据判读为飞行器状态评估提供了一种有效的途径。

目前,典型的飞行数据判读方法主要包括基于知识的方法和数据驱动的方法。基于知识的方法主要是利用专家知识,对预设定的参数进行关联分析判读,包括人工判读、基于阈值的判读和基于专家规则的判读等方法。该类方法使用相对简单,但对于数据判断的基准和阈值设置较为宽松,难以对未超出阈值的故障进行有效判读,且依赖于经验知识,无法较为广泛地应用。相比于基于知识的判读方法,数据驱动的方法则是通过飞行数据自动挖掘正常飞行状态下数据存在的规律,然后对于偏离正常的状态进行异常或者故障判读,该类方法包括基于相似性的方法、基于偏差的方法和基于概率的方法等。

虽然,上述方法在飞行数据相似性较高情况下表现出了较好的性能,但是,该类数据驱动的方法多采用单架次数据进行建模,在飞行器受到外部环境变化和人员操作差异的影响时,多架次飞行数据存在一定的差异,此时,采用单架次飞行数据建立的数据驱动数据判读方法已经无法适应飞行器各架次数据的稳定判读。因此,针对数据驱动的飞行器运行状态监测与评估问题,需要采用一种可以自动提取多架次飞行数据中表征整个飞行器运行状态规律信息的方法,实现对飞行器多架次飞行数据的表征建模,进而基于该基准模型实现各架次飞行数据的自动判读。



技术实现要素:

本发明的目的是面向飞行器的运行状态评估,解决多架次飞行数据表征建模的问题,提出了一种基于多架次飞行数据表征建模的飞行数据异常判读方法,基于此基准模型实现飞行器飞行数据的自动判读,并给出飞行数据异常告警。

本发明是通过以下方案实现的:

一种基于多架次飞行数据表征建模的飞行数据异常判读方法,

采集飞行器相同系统或部件的多架次运行所生成的飞行数据,进行数据表征建模,

步骤一:将所述飞行数据中各时间序列对齐;

步骤二:对步骤一中所述的时间序列,采用基于k-means的时间序列聚类方法,进行表征建模;

步骤三:通过基于阈值或者偏差的异常检测方法,实现飞行数据异常判读,对于超出阈值或者偏差过大的数据,判读为异常数据,并给出告警信息。

进一步地,在步骤一中:采用动态时间规整dynamictimewarping,dtw算法,对所述飞行数据中不同长度的时间序列进行对齐,所述对齐标准为长度标准化,即构造一条基准的时间序列,并将每对时间序列拉伸到基准的时间序列的长度;

对于两组不同长度飞行器作动部件的时间序列数据a和b,设时间序列数据a和b的长度分别是m和n,则有:

a=a1,a2,…,ai,…,am;(1)

b=b1,b2,…,bj,…,bn;(2)

通过构建一个m*n的矩阵网络来对齐这两个序列,矩阵中的元素(i,j)表示ai和bj两个点间的距离d(ai,bj),使用欧氏距离计算距离d(ai,bj),即d(ai,bj)=(ai-bj)2

基于所述m*n矩阵,dtw算法在网格中按照一条包含若干个点的路径,所述路径所通过的所有格点所对应的ai组成了对齐后的时间序列a′,bj组成了对齐后的时间序列b′;

将该路径定义为规整路径w,w的第k个元素定义为wk=(i,j)k,则有:

w=w1,w2,…,wk,…,wk;

max(m,n)≤k≤m n-1(3)

其中wk所对应的ai和bj能够组成对齐后的时间序列a′和b′。

进一步地,在步骤一中:针对路径的选择,需要满足如下条件:

(1)边界条件:w1=(1,1)和wk=(m,n),即所有的路径都是从左上角出发,并最终到达右下角;

(2)连续性:如果wk-1=(a′,b′),则对于路径的下一个点wk=(a,b)需要满足(a-a′)≤1和(b-b′)≤1,即不能跨过某个点去匹配,只能和自己相邻的点对齐;

(3)单调性:如果wk-1=(a′,b′),那么对于路径的下一个点wk=(a,b)需要满足0≤(a-a′)和0≤(b-b′),即限制w上面的点必须是随着时间单调进行的;

结合连续性和单调性约束,则每一个格点的路径为三个方向;

即当路径通过了格点(i,j),则下一个通过的格点为是下列三种情况之一:(i 1,j),(i,j 1)或者(i 1,j 1)。

进一步地,在步骤二中:

采用基于k-means的时间序列聚类方法,得到飞行数据中不能通过机理建模得到的数据的分布规律,并对所述数据的分布规律进行表征建模,建立该部件工作数据的基准线,或称为中心线;

设飞行器作动部件在多次飞行过程中生成n个架次的数据,经过步骤一中的dtw算法对齐后,这些飞行数据时间序列长度均为l,设所求出的中心线m=μ1,μ2,…μi,…μl,则有:

其中xl表示l时刻时间序列si上点的值,i表示第i条时间序列,时间序列总数为i个,μl表示l时刻的新的中心线的值。

进一步地,在结合dtw算法使用步骤为:

(1)首先创建一个等于最长时间序列的随机时间序列作为初始中心线,使用dtw算法将所有时间序列与中心线对齐后,计算每一条时间序列与它的距离;

(2)计算完所有距离后,使用k-means算法优化中心线,并重复对齐和优化的步骤,直到中心线符合构建模型与原始数据的距离限制或者达到指定迭代次数;得到的中心线就是新的该分类的中心线。

进一步地,在步骤三中:

对于多架次运行所生成的飞行数据判读,在获取正常工作模型之后,用该中心线对未知数据进行分析;

当异常数据与正常数据中心线的距离明显大于正常数据时,使用基于偏差的方法对测试数据进行分类;其余情况使用基于阈值的方法对测试数据进行分类;

使用基于阈值的方法时,设所有n个飞行数据时间序列与中心线的距离分别是d=d1,d2,…,dn,则距离的平均值为μ,标准差为σ,则当异常的判读阈值为μ 3σ,相应的检测公式如下:

其中,error=1表示时间序列含有异常,error=0而则不含有异常。

本发明有益效果

(1)本发明首先创建随机中心线并使用dtw算法将不同长度的飞行数据与中心线分别对齐,再通过聚类算法优化中心线,然后使用基于偏差的方法计算数据与中心线的距离实现异常检测;

(2)本发明可以在缺少飞行器异常数据样本的情况下,依赖正常多架次飞行数据建立异常监测模型,可在极低的虚警率的前提下,对测试数据的正常与否进行判读。

附图说明

图1为本发明的算法总体结构框图;

图2为本发明的作动部件原始数据,其中(1)为a状态、(2)为b状态;

图3为本发明的飞行器作动部件正常数据对齐聚类后得到的中心线,其中(1)为a状态、(2)为b状态;

图4为本发明的飞行器作动部件正常数据与异常数据各曲线与中心线间的距离,其中(1)为a状态、(2)为b状态。

具体实施方式

下面将结合本发明实施例中的附图对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例;基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

一种基于多架次飞行数据表征建模的飞行数据异常判读方法:

采集飞行器相同系统或部件的多架次运行所生成的飞行数据,因为飞行数据集中包含的时间序列长度不一致,所以在进行数据表征建模时,需要以下步骤:

步骤一:将所述飞行数据中各时间序列对齐,相同长度的时间序列可以方便地进行比较;

步骤二:对步骤一中所述的时间序列,采用基于k-means的时间序列聚类方法,进行表征建模;由于飞行器的异常样本稀缺,因此,本方法采用正常的飞行数据进行表征建模;

步骤三:通过基于阈值或者偏差的异常检测方法,实现飞行数据异常判读,对于超出阈值或者偏差过大的数据,判读为异常数据,并给出告警信息。

在步骤一中:采用动态时间规整dynamictimewarping,dtw算法,对所述飞行数据中不同长度的时间序列进行对齐,所述对齐标准为长度标准化,即构造一条基准的时间序列,并将每对时间序列拉伸到基准的时间序列的长度;

对于两组不同长度飞行器作动部件的时间序列数据a和b,设时间序列数据a和b的长度分别是m和n,则有:

a=a1,a2,…,ai,…,am;(1)

b=b1,b2,…,bj,…,bn;(2)

通过构建一个m*n的矩阵网络来对齐这两个序列,矩阵中的元素(i,j)表示ai和bj两个点间的距离d(ai,bj),使用欧氏距离计算距离d(ai,bj),即d(ai,bj)=(ai-bj)2

基于所述m*n矩阵,dtw算法在网格中按照一条包含若干个点的路径,所述路径所通过的所有格点所对应的ai组成了对齐后的时间序列a′,bj组成了对齐后的时间序列b′;

将该路径定义为规整路径w,w的第k个元素定义为wk=(i,j)k,则有:

w=w1,w2,…,wk,…,wk;

max(m,n)≤k≤m n-1(3)

其中wk所对应的ai和bj能够组成对齐后的时间序列a′和b′。

在步骤一中:针对路径的选择,需要满足如下条件:

(1)边界条件:w1=(1,1)和wk=(m,n),即所有的路径都是从左上角出发,并最终到达右下角;

(2)连续性:如果wk-1=(a′,b′),则对于路径的下一个点wk=(a,b)需要满足(a-a′)≤1和(b-b′)≤1,即不能跨过某个点去匹配,只能和自己相邻的点对齐;

(3)单调性:如果wk-1=(a′,b′),那么对于路径的下一个点wk=(a,b)需要满足0≤(a-a′)和0≤(b-b′),即限制w上面的点必须是随着时间单调进行的;

结合连续性和单调性约束,则每一个格点的路径为三个方向;

即当路径通过了格点(i,j),则下一个通过的格点为是下列三种情况之一:(i 1,j),(i,j 1)或者(i 1,j 1)。

在步骤二中:

采用基于k-means的时间序列聚类方法,挖掘在飞行数据中难以通过机理建模得到的数据的分布规律,并对所述数据的分布规律进行表征建模,建立该部件工作数据的基准线,或称为中心线;

设飞行器作动部件在多次飞行过程中生成n个架次的数据,经过步骤一中的dtw算法对齐后,这些飞行数据时间序列长度均为l,设所求出的中心线m=μ1,μ2,…μi,…μl,则有:

其中xi表示l时刻时间序列si上点的值,i表示第i条时间序列,时间序列总数为i个,μl表示l时刻的新的中心线的值。

在结合dtw算法使用步骤为:

(1)首先创建一个等于最长时间序列的随机时间序列作为初始中心线,使用dtw算法将所有时间序列与中心线对齐后,计算每一条时间序列与它的距离;

(2)计算完所有距离后,使用k-means算法优化中心线,并重复对齐和优化的步骤,直到中心线符合构建模型与原始数据的距离限制或者达到指定迭代次数;得到的中心线就是新的该分类的中心线。

在步骤三中:

对于多架次运行所生成的飞行数据判读,在获取正常工作模型之后,用该中心线对未知数据进行分析,可以甄别数据是否包含异常,使用基于偏差的方法对测试数据进行分类;由于异常数据与正常数据中心线的距离明显大于正常数据,因此使用基于偏差的方法可以更准确地区分异常数据;其余情况使用基于阈值的方法对测试数据进行分类;

使用基于阈值的方法时,设所有n个飞行数据时间序列与中心线的距离分别是d=d1,d2,…,dn,则距离的平均值为μ,标准差为σ,则当异常的判读阈值为μ 3σ,可以在保持低虚警率的同时,保持较好的故障检出率,相应的检测公式如下:

其中,error=1表示时间序列含有异常,error=0而则不含有异常。

实施例

本具体实施例主要针对飞行器作动部件的多架次飞行监测问题。

在飞行数据时间序列对齐方面,本实例使用了dtw算法,该算法是一种领域无关的时间序列对齐算法,针对不同飞行器不同部件使用时,不需要掌握相关领域知识,扩大了算法的适用度;在基于数据驱动的飞行器部件建模方面,本实例使用了k-means算法对数据进行聚类,寻找数据的中心线,实现基于相似性的时间序列分类;在基于偏差的数据自动判读方面,为保证结果的可信度,将阈值设定为平均值加三倍的标准差,即阈值外的数据是异常数据的置信度达到99.7%,这样极大地降低虚警率,保证不会因为较小的波动而导致系统报警。

对于飞行器中作动部件,如图2所示,是该部件多架次飞行过程中a状态和b状态的监测数据;图3是所有正常数据经过时间序列对齐后聚类得到的中心线。

如下表二和表三所示是正常数据与异常数据各曲线与中心线间的距离。(仅列举12组数据,每组数据中包含两个异常数据)

表二飞行器作动部件a状态时部分曲线与中心线间的距离

从表中可以看出,4、8号为异常数据,其余为正常数据。

表三飞行器作动部件b状态时正常数据与异常数据各曲线与中心线间的距离

从表中可以看出,3、8号为异常数据,其余为正常数据。

在本发明检测的某飞行器作动部件a状态中,所有正常数据的均值为0.3220,标准差为0.0790,故确定阈值为0.5590;在b状态中,所有正常数据的均值为0.1678,标准差为0.0542,故确定阈值为0.3304,实验结果如图4所示。

以上对本发明所提出的一种基于多架次飞行数据表征建模的飞行数据异常判读方法,进行了详细介绍,对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。


技术特征:

1.一种基于多架次飞行数据表征建模的飞行数据异常判读方法,其特征在于:

采集飞行器相同系统或部件的多架次运行所生成的飞行数据,进行数据表征建模,

步骤一:将所述飞行数据中各时间序列对齐;

步骤二:对步骤一中所述的时间序列,采用基于k-means的时间序列聚类方法,进行表征建模;

步骤三:通过基于阈值或者偏差的异常检测方法,实现飞行数据异常判读,对于超出阈值或者偏差过大的数据,判读为异常数据,并给出告警信息。

2.根据权利要求1所述方法,其特征在于,在步骤一中:采用动态时间规整dynamictimewarping,dtw算法,对所述飞行数据中不同长度的时间序列进行对齐,所述对齐标准为长度标准化,即构造一条基准的时间序列,并将每对时间序列拉伸到基准的时间序列的长度;

对于两组不同长度飞行器作动部件的时间序列数据a和b,设时间序列数据a和b的长度分别是m和n,则有:

a=a1,a2,…,ai,…,am;(1)

b=b1,b2,…,bj,…,bn;(2)

通过构建一个m*n的矩阵网络来对齐这两个序列,矩阵中的元素(i,j)表示ai和bj两个点间的距离d(ai,bj),使用欧氏距离计算距离d(ai,bj),即d(ai,bj)=(ai-bj)2

基于所述m*n矩阵,dtw算法在网格中按照一条包含若干个点的路径,所述路径所通过的所有格点所对应的ai组成了对齐后的时间序列a′,bj组成了对齐后的时间序列b′;

将该路径定义为规整路径w,w的第k个元素定义为wk=(i,j)k,则有:

w=w1,w2,…,wk,…,wk;

max(m,n)≤k≤m n-1(3)

其中wk所对应的ai和bj能够组成对齐后的时间序列a′和b′。

3.根据权利要求2所述方法,其特征在于,在步骤一中:针对路径的选择,需要满足如下条件:

(1)边界条件:w1=(1,1)和wk=(m,n),即所有的路径都是从左上角出发,并最终到达右下角;

(2)连续性:如果wk-1=(a′,b′),则对于路径的下一个点wk=(a,b)需要满足(a-a′)≤1和(b-b′)≤1,即不能跨过某个点去匹配,只能和自己相邻的点对齐;

(3)单调性:如果wk-1=(a′,b′),那么对于路径的下一个点wk=(a,b)需要满足0≤(a-a′)和0≤(b-b′),即限制w上面的点必须是随着时间单调进行的;

结合连续性和单调性约束,则每一个格点的路径为三个方向;

即当路径通过了格点(i,j),则下一个通过的格点为是下列三种情况之一:(i 1,j),(i,j 1)或者(i 1,j 1)。

4.根据权利要求3所述方法,其特征在于,在步骤二中:

采用基于k-means的时间序列聚类方法,得到飞行数据中不能通过机理建模得到的数据的分布规律,并对所述数据的分布规律进行表征建模,建立该部件工作数据的基准线,或称为中心线;

设飞行器作动部件在多次飞行过程中生成n个架次的数据,经过步骤一中的dtw算法对齐后,这些飞行数据时间序列长度均为l,设所求出的中心线m=μ1,μ2,…μl,…μl,则有:

其中xl表示l时刻时间序列si上点的值,i表示第i条时间序列,时间序列总数为i个,μl表示l时刻的新的中心线的值。

5.根据权利要求4所述方法,其特征在于,在结合dtw算法使用步骤为:

(1)首先创建一个等于最长时间序列的随机时间序列作为初始中心线,使用dtw算法将所有时间序列与中心线对齐后,计算每一条时间序列与它的距离;

(2)计算完所有距离后,使用k-means算法优化中心线,并重复对齐和优化的步骤,直到中心线符合构建模型与原始数据的距离限制或者达到指定迭代次数;得到的中心线就是新的该分类的中心线。

6.根据权利要求5所述方法,其特征在于,在步骤三中:

对于多架次运行所生成的飞行数据判读,在获取正常工作模型之后,用该中心线对未知数据进行分析;

当异常数据与正常数据中心线的距离明显大于正常数据时,使用基于偏差的方法对测试数据进行分类;其余情况使用基于阈值的方法对测试数据进行分类;

使用基于阈值的方法时,设所有n个飞行数据时间序列与中心线的距离分别是d=d1,d2,…,dn,则距离的平均值为μ,标准差为σ,则当异常的判读阈值为μ 3σ,相应的检测公式如下:

其中,errvr=1表示时间序列含有异常,error=0而则不含有异常。

技术总结
本发明提出一种基于多架次飞行数据表征建模的飞行数据异常判读方法,采集飞行器相同系统或部件的多架次运行所生成的飞行数据,进行数据表征建模,首先将所述飞行数据中各时间序列对齐;对于时间序列,采用基于K‑Means的时间序列聚类方法,进行表征建模;通过基于阈值或者偏差的异常检测方法,实现飞行数据异常判读,对于超出阈值或者偏差过大的数据,判读为异常数据,并给出告警信息;本发明可以在缺少飞行器异常数据样本的情况下,依赖正常多架次飞行数据建立异常监测模型,可在极低的虚警率的前提下,对测试数据的正常与否进行判读。

技术研发人员:彭宇;陈波;孟升卫;游婧婷;刘大同
受保护的技术使用者:哈尔滨工业大学
技术研发日:2021.04.12
技术公布日:2021.08.03

转载请注明原文地址:https://doc.8miu.com/read-7971.html

最新回复(0)