本发明属于制冷系统数据挖掘领域,更具体地,涉及一种用于多联机空调系统的分布式故障诊断方法及系统。
背景技术:
随着社会的发展,空调系统能耗已达建筑能耗一半,降低空调系统能耗越来越重要,多联机系统具有安装便捷、热舒适性高等优势广泛应用于各类建筑中,pier(publicinterestenergyresearch)的研究表明近50%的用户存在制冷剂充注量不合适、传感器精度差等故障。
为了节约能源、降低能耗,目前已有一些关于空调系统的故障诊断研究,例如专利《一种基于深度学习的中央空调故障诊断系统》(申请号:cn207741275u),通过控制器获取空调装置运行参数,控制器将参数传输至云服务器中,通过电脑终端获取云服务器中的运行参数通过深度学习技术进行诊断;专利《物联网环境下基于数据融合的空调故障诊断系统及方法》(申请号cn102354206a)通过无线测控模块将环境温度、湿度、二氧化碳浓度及空调参数信息传输至管理计算机,管理计算机综合上述信息进行数据处理、比较和分析,诊断空调故障。
然而,本申请经分析,目前已有的相关技术未针对多联机这一特定空调系统进行分析,传感器收集的数据的是通用空调运行数据或者环境参数,诊断精度不足。同时,现有技术是通过单一电脑终端进行故障诊断,未能解决诊断模型参数寻优效率低下的问题,模型运算速度不高;单一模型通常仅在单一故障下诊断性能较高,未实现多目标、多故障高精度诊断。
技术实现要素:
本发明提供一种用于多联机空调系统的分布式故障诊断方法及系统,用以解决现有空调故障诊断方法在对多联机进行故障诊断时存在低诊断速度和低诊断精度的缺陷而导致诊断效率不高的技术问题。
本发明解决上述技术问题的技术方案如下:一种用于多联机空调系统的分布式故障诊断方法,包括:
采集多联机空调系统的运行数据;
控制已训练好的分布式内置在不同计算gpu中的多个基础诊断模型,分别独立地基于所述运行数据进行故障诊断得到初始诊断结果;
将各所述初始故障结果与所述运行数据进行组合,并控制已训练好的内置于另一个计算gpu中的集成诊断模型,基于所述组合后的数据进行集成故障诊断,得到最终的故障诊断结果。
本发明的有益效果是:本发明采用多个基础诊断模型且这个多个基础诊断模型分布在不同的计算gpu中,实现并行分布式故障诊断,最后通过集成诊断模型进行集成诊断,该方法能解决诊断模型参数寻优效率低下的问题,运算速度高,多个模型能实现多目标、多故障高精度诊断,诊断性能优异。
上述技术方案的基础上,本发明还可以做如下改进。
进一步,所述运行数据包括:压缩机频率、风机频率、压缩机排气温度、压缩机外壳温度、冷凝温度、过冷器液出温度、过冷器气出温度、压缩机电流、压缩机电压、压缩机定性温度、风机电流、风机电压、风机温度、室内湿球温度、室内干球温度、膨胀阀开度和蒸发温度。
本发明的进一步有益效果是:采集以上数据可以有效表征多联机系统的实际运行状态,当系统发生故障时,相较于正常运行时各参数会出现不同程度的变化,故障诊断模型通过分析各参数的变化情况可以确定故障的类型,从而实现故障的诊断。
进一步,所述多个基础诊断模型包括:支持向量机、k近邻、朴素贝叶斯和决策树模型;所述集成诊断模型为多类别逻辑回归模型。
本发明的进一步有益效果是:以上几种基础诊断模型均为典型的机器学习模型,通过实验测试发现这几种模型在多联机空调系统故障诊断中的应用效果较好,选择这些模型作为基础诊断模型在一定程度上可以提高最终诊断模型的诊断效果。基础诊断模型推荐但不限于这几类模型,可以替换为诊断效果的其他模型。
进一步,在控制多个基础诊断模型进行故障诊断之前,所述方法还包括:对所述运行数据进行预处理,其中,预处理为稳态过滤器、特征选择和数据标准化中的一种或多种。
本发明的进一步有益效果是:数据预处理是提升故障诊断模型诊断精度的一个重要途径,采用不同的预处理方法可获得不同的提升效果,如稳过滤器可以过滤非稳态状态下的数据,特征选择可以提取故障关键表征变量,降低数据维度以提升模型的诊断效率,而数据标准化可以有效避免量纲差异给模型带来的不利影响。
进一步,所述多个基础诊断模型和所述集成诊断模型由以下训练方法得到:
将多工况故障数据和在线采集的多联机正常运行数据混合,对混合后的数据进行数据预处理;将预处理之后的数据分配至多个独立的计算gpu,以分别对多个基础诊断模型进行独立训练;将训练后的各模型输出结果与所述预处理之后的数据组合;控制另一个计算gpu基于所述组合后的数据训练集成诊断模型。
进一步,所述多工况故障数据包括所述多联机空调系统在三种标准工况下运行时的故障数据,该故障数据对应的故障类型有:多联机制冷剂充注量故障、传感器故障、气液分离器插反故障和压缩机停机故障。
本发明的进一步有益效果是:空调系统实际运行工况复杂多变,实验条件下无法涵盖所有运行工况,因此选择可以较好反映系统运行状态的三种标准工况进行实验以采集相关故障数据构成多工况故障数据库,实验条件允许的情况下可以增加典型的运行工况进行相关故障实验,以上几类故障是多联机系统的常见故障,实际应用时可增加不同类型的故障,扩展多工况故障数据库。
本发明还提供一种用于多联机空调系统的分布式故障诊断系统,包括:
数据采集模块,用于采集多联机空调系统的运行数据;
存储器,与所述数据采集模块通信连接,以存储所述运行数据;
多个计算gpu,均与所述存储器通信连接以进行数据的读写,且每个计算gpu中均内置有一个已训练好的诊断模型,其中,所有诊断模型包括stacking集成学习中的多个不同的基础诊断模型和一个集成诊断模型,不同的诊断模型内置于不同的计算gpu中;
管理cpu,与每个计算gpu并行通信连接,以多线程控制多个计算gpu同步且独立从所述存储器读取运行数据以运行其内的基础诊断模型并将模型输出结果写入所述存储器,还控制所述集成诊断模型所在的计算gpu从所述存储器读取各模型输出结果和所述运行数据以运行所述集成诊断模型得到诊断结果。
本发明的有益效果是:本发明提出的分布式故障诊断系统,针对多联机系统常见故障,收集特定运行数据,实现了高精度诊断,同时该诊断系统采用分布式故障诊断,将运算负荷分配至多个处理器,降低了系统运载峰值,系统运行速度提高、诊断性能增强。
进一步,所述数据采集模块与各温度传感器、压力传感器、电压计、电流计以及多联机空调系统的运行控制单元通信连接,以获取多联机空调系统的运行数据,所述运行数据包括压缩机频率、风机频率、压缩机排气温度、压缩机外壳温度、冷凝温度、过冷器液出温度、过冷器气出温度、压缩机电流、压缩机电压、压缩机定性温度、风机电流、风机电压、风机温度、室内湿球温度、室内干球温度、膨胀阀开度和蒸发温度。
进一步,所述多个基础诊断模型包括:支持向量机、k近邻、朴素贝叶斯和决策树模型;所述集成诊断模型为多类别逻辑回归模型。
进一步,所述存储器包括:相互通信连接的cpu主内存和全局共享内存;
其中,所述cpu主内存还分别与所述数据采集模块和所述管理cpu通信连接,以通过所述管理cpu的控制将所述数据采集模块采集的运行数据转存至所述全局共享内存;所述全局共享内存还与所述多个计算gpu通信连接,以存储所述各模型输出结果。
本发明的进一步有益效果是:由于主内存存储空间对于故障诊断所需存储的数据不够大,且影响计算运行速度,因此进一步设置存储空间较大的全局共享内存,以将诊断过程中所涉及的数据存储在全局共享内存中,保证了整个诊断系统运行性能不受内存空间影响。
附图说明
图1为本发明实施例提供的一种用于多联机空调系统的分布式故障诊断方法流程框图;
图2为本发明实施例提供的一种用于多联机空调系统的分布式故障诊断系统示意图;
图3为本发明实施例提供的多联机分布式故障诊断系统结构示意图;
图4为本发明实施例提供的分布式诊断模块结构示意图;
图5为本发明实施例提供的多联机制冷剂充注量诊断流程图。
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。此外,下面所描述的本发明各个实施方式中所涉及到的技术特征只要彼此之间未构成冲突就可以相互组合。
实施例一
一种用于多联机空调系统的分布式故障诊断方法,如图1所示,包括:
采集多联机空调系统的运行数据;
控制已训练好的分布式内置在不同计算gpu中的多个基础诊断模型,分别独立地基于运行数据进行故障诊断得到初始诊断结果;
将各初始故障结果与运行数据进行组合,并控制已训练好的内置于另一个计算gpu中的集成诊断模型,基于组合后的数据进行集成故障诊断,得到最终的故障诊断结果。
本实施例采用多个基础诊断模型且这个多个基础诊断模型分布在不同的计算gpu中,实现并行分布式故障诊断,最后通过集成诊断模型进行集成诊断,该方法能解决诊断模型参数寻优效率低下的问题,运算速度高,多个模型能实现多目标、多故障高精度诊断,诊断性能优异。
优选的,上述运行数据包括:压缩机频率、风机频率、压缩机排气温度、压缩机外壳温度、冷凝温度、过冷器液出温度、过冷器气出温度、压缩机电流、压缩机电压、压缩机定性温度、风机电流、风机电压、风机温度、室内湿球温度、室内干球温度、膨胀阀开度和蒸发温度。
上述运行数据包括室内数据和室外数据,可根据数据类型,选择通过温度传感器、压力传感器、电压计、电流计作为采集前端,或者从多联机空调系统的运行控制单元中获取一些控制参数(比如,压缩机频率、风机频率)。另外,对于室内数据(例如,室内湿球温度、室内干球温度、膨胀阀开度和蒸发温度),每个室内机都会对应有一组数据。
优选的,上述多个基础诊断模型包括:支持向量机、k近邻、朴素贝叶斯和决策树模型;上述集成诊断模型为多类别逻辑回归模型。
支持向量机(svm)模型采用径向基核函数,采用软间隔最大化和核技巧进行优化,优化的非线性支持向量机模型如下:
其中,训练样本集为t={(xi,yi)}1≤i≤n,yi∈{ 1,-1},xi∈rn,φ(·)为原始输入空间到高维特征空间的非线性映射,非线性支持向量机通过该映射将输入映射为特征向量,w为特征空间的超平面的法向量,b为超平面的偏置,<·,·>表示两向量的內积,ξi为松弛变量,c为惩罚参数。
k近邻(k-nearestneighbor,knn)模型采用多数表决的方法进行预测。具体的,对于一个训练祥本集t={(xi,yj)}1≤i≤n,xi∈rn为实例的特征向量,yi∈{c1,c2,...ck}为实例的类别。输入一个实例x,根据设定的距离度量方法,在训练集t中找出与x距离最近的k个点,在这包含着k个点的邻域n(x)内,依据多数表决规则确定实例x的类别y,类别判断公式如下:
其中i(·)为指示函数,yi=ci时为1,否则为0。
决策树模型采用分类与回归树(classificationandregressiontree,cart),通过基尼指数来衡量数据集的纯度。假设训练样本集d有k个类,样本属于第k类的概率为,则基尼指数的定义为:
其中ck是d中属于第k类的样本子集。
优选的,在控制多个基础诊断模型进行故障诊断之前,上述方法还包括:对运行数据进行预处理,其中,预处理为稳态过滤器、特征选择和数据标准化中的一种或多种。
优选的,上述多个基础诊断模型和集成诊断模型由以下训练方法得到:
将多工况故障数据和在线采集的多联机正常运行数据混合,对混合后的数据进行数据预处理;将预处理之后的数据分配至多个独立的计算gpu,以分别对多个基础诊断模型进行独立训练;将训练后的各模型输出结果与预处理之后的数据组合;控制另一个计算gpu基于组合后的数据训练集成诊断模型。
具体的,可分为以下步骤:
1)构建多工况故障数据库。采用一个室外数据采集单元和多个室内数据采集单元,采集多联机室内室外信息,并通过无线传输至多工况故障数据库;
2)将多工况故障数据库中的多工况故障数据和在线采集的多联机运行数据混合,对混合后的数据进行数据预处理;
3)将预处理之后的数据随机划分成训练集和测试集;
4)将划分后的训练集分配至四个独立的计算gpu,每个计算gpu分别对支持向量机、k近邻、朴素贝叶斯、决策树模型四种基础诊断模型进行训练;
5)将四种基础诊断模型输出结果与训练集组合;
6)将组合后的数据输入多类别逻辑回归模型训练,得到训练好的各个模型。
7)采用测试集重复执行第4)。
对于支持向量机、k近邻、朴素贝叶斯、决策树模型4种模型,可采用k折交叉验证划分训练集,例如:使用支持向量机作为基础模型model1,k折交叉验证就是先拿出k-1折作为训练过程的训练集,另外1折作为训练过程的测试集,此部分数据是用整个训练集进行拆分得到的。在对模型的训练集进行第一次交叉验证时,使用其中k-1折对模型进行训练,对剩下的1折进行预测分类,得到数据集a1,,同样使用训练好的该模型对数据集中的测试集进行预测,得到数据集b1,重复进行k次上述内容,最终会生成k列交叉验证测试集结果a1,a2…ak,对数据集中测试集分类同样会是k列b1,b2…bk,可以发现a1,a2…ak其实就是原来数据集中整个训练集的分类值,将它们拼接起来,作为stacking集成算法第二层模型训练集中的1个特征变量。而对于数据集的测试集的k次分类b1,b2…bk,使用投票(即取众数)的方法,得到该特征变量在第二层模型的测试集中的数值。
优选的,上述多工况故障数据包括所述多联机空调系统在三种标准工况下运行时的故障数据,该故障数据对应的故障类型有:多联机制冷剂充注量故障、传感器故障、气液分离器插反故障和压缩机停机故障。
实施例二
一种用于多联机空调系统的分布式故障诊断系统,如图2所示,包括:
数据采集模块,用于采集多联机空调系统的运行数据;
存储器,与数据采集模块通信连接,以存储运行数据;
多个计算gpu,均与存储器通信连接以进行数据的读写,且每个计算gpu中均内置有一个已训练好的诊断模型,其中,所有诊断模型包括stacking集成学习中的多个不同的基础诊断模型和一个集成诊断模型,不同的诊断模型内置于不同的计算gpu中;
管理cpu,与每个计算gpu并行通信连接,以多线程控制多个计算gpu同步且独立从存储器读取运行数据以运行其内的基础诊断模型并将模型输出结果写入存储器,还控制所述集成诊断模型所在的计算gpu从存储器读取各模型输出结果和运行数据以运行集成诊断模型得到诊断结果。
需要说明的是,如图3所示,该诊断系统还可以包括多工况故障数据库,以用于各诊断模型的训练过程。其中,分布式诊断模块包括管理cpu和计算gpu。
本实施例针对多联机系统常见故障,收集特定运行数据,实现了高精度诊断,同时本方法采用分布式故障诊断系统,将运算负荷分配至多个处理器,降低了系统运载峰值,系统运行速度提高、诊断性能增强。
优选的,数据采集模块与各温度传感器、压力传感器、电压计、电流计以及多联机空调系统的运行控制单元通信连接,以获取多联机空调系统的运行数据,所述运行数据包括压缩机频率、风机频率、压缩机排气温度、压缩机外壳温度、冷凝温度、过冷器液出温度、过冷器气出温度、压缩机电流、压缩机电压、压缩机定性温度、风机电流、风机电压、风机温度、室内湿球温度、室内干球温度、膨胀阀开度和蒸发温度。
优选的,多个基础诊断模型包括:支持向量机、k近邻、朴素贝叶斯和决策树模型;集成诊断模型为多类别逻辑回归模型。
管理cpu将cpu主内存内的原始输入数据输入支持向量机、k近邻、朴素贝叶斯及决策树模型四种基础诊断模型进行训练或初步诊断,每一种基础诊断模型由一个单独的计算gpu负责;管理cpu还控制四种基础诊断模型输出结果保存至全局共享内存,进一步还控制一个计算gpu获取全局共享内存中的四个输出结果和原始输入数据以进行训练或诊断。
优选的,如图4所示,分布式诊断模块也包括存储器,其中存储器包括:相互通信连接的cpu主内存和全局共享内存。其中,cpu主内存还分别与数据采集模块和管理cpu通信连接,以通过管理cpu的控制将数据采集模块采集的运行数据转存至全局共享内存(也就是在管理cpu的控制下存储数据采集模块采集的运行数据并将其转存至全局共享内存);全局共享内存还与多个计算gpu通信连接,以存储各模型输出结果。
本实施例的故障诊断系统包括一个管理cpu和多个计算gpu,管理cpu还包含一个cpu主板和cpu主内存,管理cpu多线程控制计算gpu,具体为管理cpu平衡各计算gpu的计算负载,分配任务至多个计算gpu,并将数据传输至全局共享内存。各计算gpu之间互相独立,负责诊断计算,gpu计算分布结果传输至全局共享内存,最终集成结果被传输至cpu主内存。本实施例相关技术方案同实施例一,在此不再赘述。
为了更好的说明本发明的故障诊断流程,先给出如下示例:
如图5所示,多联机制冷剂充注量诊断流程图,多联机变制冷剂流量运行数据首先进行数据预处理,数据预处理包含稳态过滤器、特征选择和数据标准化三个步骤,数据预处理结束后,数据被随机划分为训练集和测试集,训练集通过k折交叉验证进一步划分,划分后的数据分配至支持向量机、k近邻、朴素贝叶斯、决策树模型4中基模型分别进行故障诊断,四种基础诊断模型结果与原始输入特征组合,组合后的数据输入多类别逻辑回归模型进行故障诊断,并输出最终故障诊断结果。
本领域的技术人员容易理解,以上所述仅为本发明的较佳实施例而已,并不用以限制本发明,凡在本发明的精神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
1.一种用于多联机空调系统的分布式故障诊断方法,其特征在于,包括:
采集多联机空调系统的运行数据;
控制已训练好的分布式内置在不同计算gpu中的多个基础诊断模型,分别独立地基于所述运行数据进行故障诊断得到初始诊断结果;
将各所述初始故障结果与所述运行数据进行组合,并控制已训练好的内置于另一个计算gpu中的集成诊断模型,基于所述组合后的数据进行集成故障诊断,得到最终的故障诊断结果。
2.根据权利要求1所述的一种用于多联机空调系统的分布式故障诊断方法,其特征在于,所述运行数据包括:压缩机频率、风机频率、压缩机排气温度、压缩机外壳温度、冷凝温度、过冷器液出温度、过冷器气出温度、压缩机电流、压缩机电压、压缩机定性温度、风机电流、风机电压、风机温度、室内湿球温度、室内干球温度、膨胀阀开度和蒸发温度。
3.根据权利要求1所述的一种用于多联机空调系统的分布式故障诊断方法,其特征在于,所述多个基础诊断模型包括:支持向量机、k近邻、朴素贝叶斯和决策树模型;所述集成诊断模型为多类别逻辑回归模型。
4.根据权利要求1所述的一种用于多联机空调系统的分布式故障诊断方法,其特征在于,在控制多个基础诊断模型进行故障诊断之前,所述方法还包括:对所述运行数据进行预处理,其中,预处理为稳态过滤器、特征选择和数据标准化中的一种或多种。
5.根据权利要求1所述的一种用于多联机空调系统的分布式故障诊断方法,其特征在于,所述多个基础诊断模型和所述集成诊断模型由以下训练方法得到:
将多工况故障数据和在线采集的多联机正常运行数据混合,对混合后的数据进行数据预处理;将预处理之后的数据分配至多个独立的计算gpu,以分别对多个基础诊断模型进行独立训练;将训练后的各模型输出结果与所述预处理之后的数据组合;控制另一个计算gpu基于所述组合后的数据训练集成诊断模型。
6.根据权利要求5所述的一种用于多联机空调系统的分布式故障诊断方法,其特征在于,所述多工况故障数据包括所述多联机空调系统在三种标准工况下运行时的故障数据,该故障数据对应的故障类型有:多联机制冷剂充注量故障、传感器故障、气液分离器插反故障和压缩机停机故障。
7.一种用于多联机空调系统的分布式故障诊断系统,其特征在于,包括:
数据采集模块,用于采集多联机空调系统的运行数据;
存储器,与所述数据采集模块通信连接,以存储所述运行数据;
多个计算gpu,均与所述存储器通信连接以进行数据的读写,且每个计算gpu中均内置有一个已训练好的诊断模型,其中,所有诊断模型包括stacking集成学习中的多个不同的基础诊断模型和一个集成诊断模型,不同的诊断模型内置于不同的计算gpu中;
管理cpu,与每个计算gpu并行通信连接,以多线程控制多个计算gpu同步且独立从所述存储器读取运行数据以运行其内的基础诊断模型并将模型输出结果写入所述存储器,还控制所述集成诊断模型所在的计算gpu从所述存储器读取各模型输出结果和所述运行数据以运行所述集成诊断模型得到诊断结果。
8.根据权利要求7所述的一种用于多联机空调系统的分布式故障诊断系统,其特征在于,所述数据采集模块与各温度传感器、压力传感器、电压计、电流计以及多联机空调系统的运行控制单元通信连接,以获取多联机空调系统的运行数据,所述运行数据包括压缩机频率、风机频率、压缩机排气温度、压缩机外壳温度、冷凝温度、过冷器液出温度、过冷器气出温度、压缩机电流、压缩机电压、压缩机定性温度、风机电流、风机电压、风机温度、室内湿球温度、室内干球温度、膨胀阀开度和蒸发温度。
9.根据权利要求7所述的一种用于多联机空调系统的分布式故障诊断系统,其特征在于,所述多个基础诊断模型包括:支持向量机、k近邻、朴素贝叶斯和决策树模型;所述集成诊断模型为多类别逻辑回归模型。
10.根据权利要求7至9任一项所述的一种用于多联机空调系统的分布式故障诊断系统,其特征在于,所述存储器包括:相互通信连接的cpu主内存和全局共享内存;
其中,所述cpu主内存还分别与所述数据采集模块和所述管理cpu通信连接,以通过所述管理cpu的控制将所述数据采集模块采集的运行数据转存至所述全局共享内存;所述全局共享内存还与所述多个计算gpu通信连接,以存储所述各模型输出结果。
技术总结