本发明涉及一种基于数据挖掘的煤矿风险预防和救援决策系统,属于数据挖掘领域和煤矿安全领域。
背景技术:
我国是一个资源比较丰富的地方,尤其是煤矿资源。相对于煤矿的其他地方,矿井内又是一个最为危险的地方,产生危险的因素主要有:瓦斯、顶板、运输、冲击地压、火灾、水害、机电等。煤矿事故对人民的生命和财产造成了严重的损失,我们可以发现在矿井中出现事故的因素有很多种,所以实时监测这些因素的一个数值,然后去进行预测可以让系统做出相应防护。
在现有的预防技术中,只能针对一个特定的事故去进行一个预测,现实中只做一种预防远远不能够满足人们的安全生产需求。随着科技发展引入智能高效的风险预防和应对已经发生危险正确处理救援决策的系统是必然趋势,也只有这样才可以保证高质量的生产。
技术实现要素:
针对现有预防技术的不足,本发明的目的是提供一种基于数据挖掘的煤矿风险预防和救援决策的系统,将先进的数据挖掘技术应用于矿井中各种数据处理,然后采用svm分类进行预测模型的构建,进而去预测风险,并做出相应预防来杜绝危险,救援决策方向采用预训练好的bert中文模型,将各种成功的救援情况和方案去对bert进行微调,然后根据情况给出措施。
实现本发明采用的技术方案是:本发明采用了pearson积矩系数做相关性检测去除数据冗余,决策树特征提取和svm分类模型的数据挖掘技术和分类算法手段去完成风险预防阶段的任务,然后针对发生的事故去使用微调好bert模型,给出措施,具体按照下面步骤进行:
(1)风险防护模块:
第一步数据收集过程:在煤矿的生产中矿井中的各种属性值都量化成了数值属性,我们先将之前的所有这些数据都收集起来,为分析做准备。
第二步专家标注类标签:将收集到的数据给专家分析,让专家对这些数据进行分类,为了之后我们训练系统做准备。
第三步数据规范化过程:由于数值属性大小不一,会加重我们的分析负担。所以采用最小-最大规范化公式:
第四步相关性分析去冗余:对于数值属性,我们通过计算属性a和b的pearson积矩系数公式:
第五步决策树进行特征选择:设置一个属性选择的最小阈值只要满足这个阈值就将这个属性保留。主要的选择指标有信息熵公式:
将导致风险的属性进行保留,信息增益公式:gain(d,a)=h(d)-h(d|a),其中
第六步避免连锁事故发生寻找各事故之间的频繁因素:将上一步选择出来导致事故发生的因素进行一个整合之后,开始挖掘这些事故的频繁因素,然后对于这些挖掘出来的频繁因素进行更加严格的监控,避免连锁事故的发生。在寻找频繁因素的时候主要使用的是apriori先验算法,是通过计算a和b事件的支持度公式:support=p(a∪b),指事件a和b同时发生的概率,还有置信度
第七步svm训练模型:svm支持向量机,主要针对小样本数据、非线性及高维模式识别中表现出许多特有的优势,而且有很好的泛化能力。所以我们此处采用svm去训练此系统的分类器。此处主要是使用了高斯核函数公式:k(xi,xj)=exp(-γ||xi-xj||2)去进行一个高维的投影,然后在高维空间寻找到一个分割面,在映射到低维空间。
(2)救援决策模块:
第一步成功救援数据收集:将历史上各种救援成功的文档进行收集,其中内容要求要有各种现场情况和如何救援的方案。
第二步数据处理:将收集到的文档数据进行划分,主要就是将每一种现场情况和每一种救援进行摘取出来,放入表格里面不同的列,为下一步做准备。
第三步中文bert模型微调:首先bert是采用了transformer的encode部分去进行组合的一个自然语言处理深度学习模型。而transformer中最为重要的是self-attention机制,计算公式是:
第四步救援决策给出:使用者对系统述说现在情况,系统给出救援方案去帮助做出最优的救援方案。
本发明的有益效果是:
(1)传统的风险防护,仅仅能够针对一种风险去做预防,但是这个系统可以针对多种风险去进行防护,只要你有对应的数据去训练出每种风险对应svm模型就可以去做防护。而且较之前仅有的风险预测,现在添加了救援决策模块以应对发生大的事故。
(2)将先进的数据挖掘技术应用于矿井中各种数据处理,然后采用svm分类进行预测模型的构建,进而去预测风险,并做出相应预防杜绝危险,救援决策方向采用预训练好的bert中文模型,将各种成功的救援情况和方案去对bert进行微调,然后根据情况给出措施。
附图说明
图1是该系统软件的模块图。
图2是该系统软件的用例图。
图3是该系统进行风险预测的流程图。
图4是该系统进行决策的流程图。
具体实施方式
下面将结合本发明实施例中的附图,进行具体说明。
我们这个系统的模块图如图1所示,它主要是由三部分大模块组成,分别是:生成模型模块,风险预防模块,救援决策模块。其中生成模型模块的工作是生成一个预测模型去判断是否会有风险,在其中数据处理模块列举了三种风险,其实他可以适用各种风险只要有数据和类标签;风险预防模块的工作是获取实时数据,然后利用上一步获取的模型去做一个风险预测起到及时规避风险的作用;救援决策模块的工作是就是针对现场情况将如何进行救援的方案给出。然后分别展示了每个大模块下面的子模块,它们之间相互配合完成整个系统的工作。
如图2是此系统的一个用例图,就是展示了此系统的使用者分别去使用此系统的一个功能体现。简单而言此系统针对3部分人群,首先就是构建系统的技术人员,他首先根据每一部分的所要完成的工作去对系统进行一个构造,还负责系统在之后使用过程中的更新功能,以及使用者的一个权限管理,使得他们只能够完成属于自己的那一部分操作,以免因误操作使系统出现错误而导致发生事故;员工主要就是负责将系统的一个监测器去打开,让系统去实时的获取需要监控的数值,然后系统的风险防护功能去判别是否会有风险发生,进而去做一个及时的处理;领导主要就是使用系统的一个决策功能,也就是在发生事故之后,对系统述说现场情况,然后给出成功的救援方案。
如图3是此系统进行风险预防时的流程图,步骤分别是:
第一步数据收集过程:在煤矿的生产中矿井中的各种属性值都量化成了数值属性,我们先将之前的所有这些数据都收集起来,为分析做准备。
第二步专家标注类标签:将收集到的数据给专家分析,让专家对这些数据进行分类,为了之后我们训练系统做准备。
第三步数据规范化过程:由于数值属性大小不一,会加重我们的分析负担。所以采用最小-最大规范化公式:
第四步相关性分析去冗余:对于数值属性,我们通过计算属性a和b的pearson积矩系数公式:
第五步决策树进行特征选择:设置一个属性,选择的最小阈值只要满足这个阈值就将这个属性保留。主要的选择指标有信息熵公式:
将导致风险的属性进行保留,信息增益公式:gain(d,a)=h(d)-h(d|a),其中
第六步避免连锁事故发生寻找各事故之间的频繁因素:将上一步选择出来导致事故发生的因素进行一个整合之后,开始挖掘这些事故的频繁因素,然后对于这些挖掘出来的频繁因素进行更加严格的监控,避免连锁事故的发生。在寻找频繁因素的时候主要使用的是apriori算法,是通过计算a和b事件的支持度公式:support=p(a∪b),指事件a和b同时发生的概率,还有置信度
第七步svm训练模型:svm支持向量机,主要针对小样本数据、非线性及高维模式识别中表现出许多特有的优势,而且有很好的泛化能力。所以我们此处采用svm去训练此系统的分类器。此处主要是使用了高斯核函数公式:k(xi,xj)=exp(-γ||xi-xj||2)去进行一个高维的投影,然后在高维空间寻找到一个分割面,在映射到低维空间。
第八步传感器实时数据获取:根据第五步获取的属性进行一个实时的数据获取。
第九步训练好的模型实时监控:将第七步获取的数据传入系统中,然后svm分类器去判断是否会有风险,然后起到杜绝风险的一个作用。
如图4是此系统进行救援决策时的流程图,步骤分别是:
第一步成功救援数据收集:将历史上各种救援成功的文档进行收集,其中内容要求要有各种现场情况和如何救援的方案。
第二步数据处理:将收集到的文档数据进行划分,主要就是将每一种现场情况和每一种救援进行摘取出来,放入表格里面不同的列,为下一步做准备。
第三步中文bert模型微调:首先bert是采用了transformer的encode部分去进行组合的一个自然语言处理深度学习模型。而transformer中最为重要的是self-attention机制,计算公式是:
第四步救援决策给出:使用者对系统述说现在情况,系统给出救援方案去帮助做出最优的救援方案。
1.一种基于数据挖掘的煤矿风险预防和救援决策系统,其特征在于:生成模型模块,风险预防模块,救援决策模块。
2.根据权利要求1所述基于数据挖掘的煤矿风险预防和救援决策系统,其特征在于:风险预防的方法其中还包含了生成模型的过程按照下面步骤进行:
第一步数据收集过程:在煤矿的生产中矿井中的各种属性值都量化成了数值属性,我们先将之前的所有这些数据都收集起来,为分析做准备。
第二步专家标注类标签:将收集到的数据给专家分析,让专家对这些数据进行分类,为了之后我们训练系统做准备。
第三步数据规范化过程:由于数值属性大小不一,会加重我们的分析负担。所以采用最小-最大规范化公式:
第四步相关性分析去冗余:对于数值属性,我们通过计算属性a和b的pearson积矩系数公式:
第五步决策树进行特征选择:设置一个属性,选择的最小阈值只要满足这个阈值就将这个属性保留。主要的选择指标有信息熵公式:
将导致风险的属性进行保留,信息增益公式:gain(d,a)=h(d)-h(d|a),其中
第六步避免连锁事故发生寻找各事故之间的频繁因素:将上一步选择出来的导致事故发生的因素进行一个整合之后,开始挖掘这些事故的频繁因素,然后对于这些挖掘出来的频繁因素进行更加严格的监控,避免连锁事故的发生。在寻找频繁因素的时候主要使用的是apriori算法,是通过计算a和b事件的支持度公式:support=p(a∪b),指事件a和b同时发生的概率,还有置信度
第七步svm训练模型:我们此处采用svm去训练此系统的分类器。此处主要是使用了高斯核函数公式:k(xi,xj)=exp(-γ||xi-xj||2)去进行一个高维的投影,然后在高维空间寻找到一个分割面,在映射到低维空间。
第八步传感器实时数据获取:根据第五步获取的属性进行一个实时的数据获取。
第九步训练好的模型实时监控:将第七步获取的数据传入系统中,通过svm分类器去判断是否会有风险,然后起到杜绝风险的一个作用。
3.根据权利要求1所述基于数据挖掘的煤矿风险预防和救援决策系统,其特征在于:救援决策的方法按照下面步骤进行:
第一步成功救援数据收集:将历史上各种救援成功的文档进行收集,其中内容要求有各种现场情况和如何救援的方案。
第二步数据处理:将收集到的文档数据进行划分,主要就是将每一种现场情况和每一种救援方案摘取出来,放入表格里面不同的列,为下一步做准备。
第三步中文bert模型微调:首先bert是采用了transformer的encode部分去进行组合的一个自然语言处理深度学习模型。而transformer中最为重要的是self-attention机制,计算公式是:
第四步救援决策给出:使用者对系统述说现在情况,系统给出救援方案去帮助做出最优的救援方案。
4.根据权利要求1所述基于数据挖掘的煤矿风险预防和救援决策系统,其特征在于:将风险预防和救援决策进行了一个结合,使系统的功能更加完善。
技术总结