基于大数据的汽车故障检测方法与流程

专利2025-07-12  3


本发明涉及汽车故障检测,具体是指基于大数据的汽车故障检测方法。


背景技术:

1、基于大数据的汽车故障检测方法是利用大数据技术和相关算法来识别和预测汽车故障的方法。它通过收集、存储、处理和分析大量的汽车传感器数据、车辆运行数据和维修记录等信息,从中挖掘出与汽车故障相关的模式、规律和异常,以实现故障的早期发现、预测和诊断。但是一般汽车故障检测方法存在原始数据维度过多导致数据计算量过大、特征提取效果不佳导致特征的可解释性低,特征选择的准确性差,从而导致故障检测结果精准度低的问题;一般汽车故障检测方法存在模型损失设计不当导致模型无法准确拟合数据,模型参数优化不佳导致模型性能过低的问题。


技术实现思路

1、针对上述情况,为克服现有技术的缺陷,本发明提供了基于大数据的汽车故障检测方法,针对一般汽车故障检测方法存在原始数据维度过多导致数据计算量过大、特征提取效果不佳导致特征的可解释性低,特征选择的准确性差,从而导致故障检测结果精准度低的问题,本方案通过层次化的方式对特征进行分组,使用累积支配比较来确定特征之间的支配关系;客观地评估特征的重要性,避免主观设定阈值的情况,提高了特征选择的准确性;在特征提取过程中,通过设定移除阈值和验证方法;并优先考虑高层次的特征组合;增强了模型对数据的表征能力,增强了模型的稳定性和可靠性;针对一般汽车故障检测方法存在模型损失设计不当导致模型无法准确拟合数据,模型参数优化不佳导致模型性能过低的问题,本方案采用了输入层、moe层和输出层的架构,通过门控网络动态选择每个lstm子模型的输出结果,提高了模型的灵活性和鲁棒性;损失函数考虑专家网络的输出和真实标签之间的误差,使得模型更加准确地拟合数据;基于渐变增强回归树对模型参数进行优化,保证模型的准确性和稳定性。

2、本发明采取的技术方案如下:本发明提供的基于大数据的汽车故障检测方法,该方法包括以下步骤:

3、步骤s1:数据采集;

4、步骤s2:数据预处理;

5、步骤s3:特征层次化;

6、步骤s4:寻找最优组合层次数;

7、步骤s5:特征提取;

8、步骤s6:建立汽车故障检测模型;

9、步骤s7:汽车故障检测。

10、进一步地,在步骤s1中,所述数据采集是采集历史数据;所述历史数据包括传感器数据、车辆维修记录、运行环境数据、操作数据、车辆特征数据、电池数据、车辆声音数据、时间数据和汽车检测结果,所述汽车检测结果包括汽车正常和汽车故障类型,将汽车检测结果作为数据标签。

11、进一步地,在步骤s2中,所述数据预处理是对采集的数据进行数据清洗、数据转化、标准化处理和数据集划分;所述数据清洗是对缺失值、重复值和异常值处理;所述数据转化是将数据转化为向量形式,最终得到时间序列数据集;所述标准化处理是基于最大最小归一化法对数据标准化处理;所述数据集划分是将数据划分为训练集和测试集。

12、进一步地,在步骤s3中,所述特征层次化是根据特征之间的累积支配关系,将特征分层;具体包括以下步骤:

13、步骤s31:初始化:对特征集初始化,设置层级索引front为1,创建空列表f(front).f用于存储特征;对于每个特征i,初始化n为0,s为空列表;遍历特征,并进行特征之间的累积支配比较,如果第i个特征支配另一个特征,则将被支配的特征添加到第i个特征的列表s中,否则第i个特征的n加1;遍历结束后,如果n等于0,意味着第i个特征是最高的非支配级别特征,将特征i存储在当前的front层中;累积支配比较过程如下:

14、步骤s311:对类别k遍历,对于任意两个特征,如果p(i,k)<p(j,k),将dom_less加1;如果p(i,k)=p(j,k),将dom_equal加1;如果p(i,k)>p(j,k),将dom_more加1;其中,p(i,k)和p(j,k)分别是第i个特征和第j个特征与第k个类别之间的互信息;dom_less、dom_equal和dom_more是用于累积支配计数的值;

15、步骤s312:累积支配判定,如果dom_more等于0且dom_equal不等于类别数,则特征i被特征j支配;如果dom_less等于0且dom_equal不等于类别数,则特征i支配特征j;

16、步骤s32:对于当前front层的特征集f(front).f,如果为空,则执行以下循环:

17、步骤s321:创建一个空列表q用于存储下一个优先级中的特征;

18、步骤s322:遍历特征,如果特征的s不为空,对s中每个特征进行遍历:每次遍历时将n减1;如果n等于0,则将遍历的特征添加到q中,表示这些特征存储在下一个优先级中;

19、步骤s323:将front加1,移动到下一个级别,并将f(front).f设置为q中存储的特征集;

20、步骤s33:重复步骤s32,直到所有特征都被处理完毕;

21、步骤s34:返回构建好的层次化特征集f。

22、进一步地,在步骤s4中,所述寻找最优组合层次数是确定最优的特征组合层次数,以便进行特征分组;具体包括以下步骤:

23、步骤s41:预设置,计算层数di;总特征数量wi;初始化孔数组tn,用于记录每层中的特征数量;遍历层数,对于每个层,将该层中特征的数量ttn添加到tn中;

24、步骤s42:确定层次数,如果di不小于2;初始化层次数ki=2,令k=di-ki+1,k是最大可用层次数;初始化summ为空数组;对于每个从1到k的i,计算每两层特征数量的总和,并将其添加到summ中;记录第一层和最后一层的特征数量之和;如果di小于2,计算summ为tn中所有层特征数量的总和;

25、步骤s43:计算最大特征数量,计算maxtn为summ中的最大值;将ti设为wi的一半,即总特征数量的一半;

26、步骤s44:调整层次数,具体包括:

27、步骤s441:如果maxtn不小于ti,则将ki设置等于di;

28、步骤s442:当maxtn小于ti时;

29、步骤s4421:逐步增加ki,更新k=di-ki+1,重置summ为一个空数组;

30、步骤s4422:对于每个从1到k的索引j,计算每两层特征数量的总和,并将其添加到summ中;

31、步骤s4423:更新maxtn为summ中的最大值;更新ti为wi除以ki的四舍五入值;

32、步骤s4424:若maxtn不小于ti,转至步骤s45;否则转至步骤s4421;

33、步骤s45:返回最佳层次数ki。

34、进一步地,在步骤s5中,所述特征提取具体包括以下步骤:

35、步骤s51:特征移除,预先设有移除阈值,将与所有类别的互信息均低于移除阈值的特征删除;

36、步骤s52:特征分组,基于最佳层次数将特征分组形成ki个特征子集;并进行高层次优先组合,如果特征层数大于最优层数,则按照从高层到低层的顺序进行特征组合;

37、步骤s53:特征选择,对生成的特征子集进行验证,并选择最佳的特征子集作为特征提取结果,并更新特征提取后的训练集和测试集。

38、进一步地,在步骤s6中,所述建立汽车故障检测模型具体包括以下步骤:

39、步骤s61:模型架构设计,所建立汽车故障检测模型包括输入层、moe层和输出层;输入层接收特征提取后数据集,并将其转换为离散事件序列;moe层由多个专家网络组成,每个专家网络是一个lstm网络,用于学习数据的特征和长期依赖关系;门控网络决定每个专家网络对输入数据的重要性;输出层接收moe层的输出,并进行最终的预测;

40、步骤s62:输入层设计,输入层由输入样本数据和多个不同的lstm子模型组成;具体来说,时间序列样本数据被输入到不同的lstm子模型中,每个lstm子模型单元通过使用上一时刻输出作为当前时刻输入来传递时间信息;每个lstm子模型的学习结果用概率分布来表示;所用表示如下:

41、;

42、;

43、;

44、式中,yt+1和yt分别是第t+1时刻和第t时刻的lstm子模型预测结果;argmaxγ1是在给定条件下使得概率最大化的操作符,γ1是门控机制;n是lstm子模型数量;是模型预测的概率分布;y是模型预测结果;xt+1是第t+1时刻输入样本数据;y(xi)是汽车故障检测模型对第i个输入样本的输出结果;g(xi)e是门控网络对于第i个输入样本的第e个lstm子模型的输出;fe(xi)是第i个输入样本在第e个lstm子模型中的输出结果;是门控网络的输出;wg是门控网络的权重矩阵;softmax(·)是softmax激活函数;

45、步骤s63:moe层设计,moe层由多个专家网络组成;首先,上游输入层的学习结果被输入到专家网络中,每个专家网络负责通过门控网络动态选择用于上游输入样本的lstm;然后,多个专家网络的输出映射到一个权重向量;损失函数表示如下:

46、;

47、式中,l是损失函数;gi是第i个专家网络的输出,是一个权重向量,用于动态选择每个lstm子模型的输出结果的权重;y是输入样本真实标签;fi是模型预测标签;i是样本总数;

48、步骤s64:输出层设计,输出层通过多层专家模型的权重计算来生成最终的输出结果;并基于梯度调整模型参数;最终模型的输出结果是所有lstm子模型的输出向量矩阵和权重向量gi的乘积;所用公式如下:

49、;

50、;

51、式中,是损失函数对每个lstm子模型输出fi的梯度,用于修正每个lstm子模型的参数;是损失函数l对每个输入样本xi的梯度,用于修正专家网络权重;

52、步骤s65:模型参数优化,基于渐变增强回归树建立学习器对模型参数优化;具体包括:

53、步骤s651:初始化弱学习器,初始化第一个回归树,使其最小化损失函数;表示如下:

54、;

55、式中,f0(x)是第一个回归树的预测函数,表示模型的初始状态;n是训练集样本数量;c是回归树参数,表示当前学习器的状态;argmin是最小化时取参数操作符;l(yi,c)是当前学习器状态下汽车故障检测模型的损失;

56、步骤s652:对于样本计算负梯度,渐变增强回归树在迭代过程中,每次迭代都会产生新的回归树,其中每棵新的回归树都是在前一棵树的负梯度上进行训练;计算负梯度所用公式如下:

57、;

58、式中,rim是第i个样本的负梯度;l(yi-f(xi))是当前模型状态下,对于第x个样本,真实标签和汽车故障检测模型预测值之间的损失;f(x)=f(m-1)x表示当前的预测模型与第m−1次迭代得到的回归树相等;f(x)是渐变增强回归树的输出;

59、步骤s653:将计算得到的负梯度视为样本的真实值,并将数据(xi,rim)视为下一个树的训练数据,以获得新的回归树fm(x),每个叶节点代表了一个数据的预测结果;将新的回归树对应的叶节点记为rjm;

60、步骤s654:对于叶节点区域,计算最佳拟合值;

61、;

62、式中,zrim是第i个样本在第m次迭代中的最佳拟合值;l(yi,fm-1(xi)+γ)是用于衡量预测值为fm-1(xi)+γ与真实值的损失;fm-1(xi)是第m-1次迭代得到的学习器的预测值;γ是对当前叶节点区域的拟合值调整量;

63、步骤s655:更新学习器,并得到最终学习器,此时学习器表示的汽车故障检测模型参数最优;所用公式如下:

64、;

65、;

66、式中,fm(x)是第m次迭代时的学习器,也是新的回归树;是第m次迭代时第j个叶节点区域的最佳拟合值;i(·)是指示函数;j是叶节点数;f(x)是最终的学习器;m是最大迭代次数;

67、步骤s66:模型评估,预先设有正确率阈值,当基于训练集训练完成的汽车故障检测模型对测试集的预测率高于正确率阈值时,汽车故障检测模型建立完成;否则重新划分数据集训练模型。

68、进一步地,在步骤s7中,所述汽车故障检测是基于建立完成的汽车故障检测模型,采集汽车故障检测实时数据,将汽车故障检测模型对实时数据的输出作为汽车故障检测结果。

69、采用上述方案本发明取得的有益效果如下:

70、(1)针对一般汽车故障检测方法存在原始数据维度过多导致数据计算量过大、特征提取效果不佳导致特征的可解释性低,特征选择的准确性差,从而导致故障检测结果精准度低的问题,本方案通过层次化的方式对特征进行分组,使用累积支配比较来确定特征之间的支配关系;客观地评估特征的重要性,避免主观设定阈值的情况,提高了特征选择的准确性;在特征提取过程中,通过设定移除阈值和验证方法;并优先考虑高层次的特征组合;增强了模型对数据的表征能力,增强了模型的稳定性和可靠性。

71、(2)针对一般汽车故障检测方法存在模型损失设计不当导致模型无法准确拟合数据,模型参数优化不佳导致模型性能过低的问题,本方案采用了输入层、moe层和输出层的架构,通过门控网络动态选择每个lstm子模型的输出结果,提高了模型的灵活性和鲁棒性;损失函数考虑专家网络的输出和真实标签之间的误差,使得模型更加准确地拟合数据;基于渐变增强回归树对模型参数进行优化,保证模型的准确性和稳定性。


技术特征:

1.基于大数据的汽车故障检测方法,其特征在于:该方法包括以下步骤:

2.根据权利要求1所述的基于大数据的汽车故障检测方法,其特征在于:在步骤s3中,所述特征层次化是根据特征之间的累积支配关系,将特征分层;具体包括以下步骤:

3.根据权利要求2所述的基于大数据的汽车故障检测方法,其特征在于:在步骤s31中,所述累积支配比较具体包括以下步骤:

4.根据权利要求1所述的基于大数据的汽车故障检测方法,其特征在于:在步骤s6中,所述建立汽车故障检测模型具体包括以下步骤:

5.根据权利要求4所述的基于大数据的汽车故障检测方法,其特征在于:在步骤s65中,所述模型参数优化是基于渐变增强回归树建立学习器对模型参数优化;具体包括:

6.根据权利要求1所述的基于大数据的汽车故障检测方法,其特征在于:在步骤s4中,所述寻找最优组合层次数是确定最优的特征组合层次数,以便进行特征分组;具体包括以下步骤:

7.根据权利要求1所述的基于大数据的汽车故障检测方法,其特征在于:在步骤s5中,所述特征提取具体包括以下步骤:

8.根据权利要求1所述的基于大数据的汽车故障检测方法,其特征在于:在步骤s1中,所述数据采集是采集历史数据;所述历史数据包括传感器数据、车辆维修记录、运行环境数据、操作数据、车辆特征数据、电池数据、车辆声音数据、时间数据和汽车检测结果,所述汽车检测结果包括汽车正常和汽车故障类型,将汽车检测结果作为数据标签。

9.根据权利要求1所述的基于大数据的汽车故障检测方法,其特征在于:在步骤s2中,所述数据预处理是对采集的数据进行数据清洗、数据转化、标准化处理和数据集划分;所述数据清洗是对缺失值、重复值和异常值处理;所述数据转化是将数据转化为向量形式,最终得到时间序列数据集;所述标准化处理是基于最大最小归一化法对数据标准化处理;所述数据集划分是将数据划分为训练集和测试集。

10.根据权利要求1所述的基于大数据的汽车故障检测方法,其特征在于:在步骤s7中,所述汽车故障检测是基于建立完成的汽车故障检测模型,采集汽车故障检测实时数据,将汽车故障检测模型对实时数据的输出作为汽车故障检测结果。


技术总结
本发明公开了基于大数据的汽车故障检测方法,方法包括数据采集、数据预处理、特征层次化、寻找最优组合层次数、特征提取、建立汽车故障检测模型和汽车故障检测。本发明属于汽车故障检测技术领域,具体是指基于大数据的汽车故障检测方法,本方案通过层次化的方式对特征进行分组,提高了特征选择的准确性;通过设定移除阈值和验证方法;并优先考虑高层次的特征组合;增强了模型对数据的表征能力;采用了输入层、MoE层和输出层的架构,通过门控网络动态选择输出结果,提高了模型的灵活性和鲁棒性;损失函数考虑专家网络的输出和真实标签之间的误差,使得模型更加准确地拟合数据;基于渐变增强回归树对模型参数进行优化,保证模型的准确性和稳定性。

技术研发人员:孙大亮,赵启超
受保护的技术使用者:北京德和顺天科技有限公司
技术研发日:
技术公布日:2024/6/26
转载请注明原文地址:https://doc.8miu.com/read-1822385.html

最新回复(0)