本发明涉及一种实时性网络故障自适应链路检查及恢复方法,属于工业网络通讯。
背景技术:
1、工业现场网络信号采集手段来源复杂,数据汇总时各个层级跳转繁复。一般的,工业网络覆盖范围即包括位于主干或分支网络的以太网类通讯接口,也包括位于采集设备前端的can/rs485/rs232等串行通讯接口。当系统中对设备操作存在一定的实时性要求时,即使网络中为了保证设备接入性,应用双/多冗余方法对设备都留有冗余通道,也会难免在线路部分故障后形成网络拥塞给系统正常通讯造成长时间干扰,影响实时数据的同步达到与运算时间,严重的甚至导致系统触发安全性保护措施。
2、申请号为cn 201910165528.7的中国专利申请公布了一种多区域故障基于灾难预测的蚁群优化虚拟网络映射方法,在光纤通信网络中利用虚拟网络评估物理链路潜在故障,与实际工业现场应用仍有差距,当设备发生故障确实可预估性恢复部分带宽,降低网络拥塞,却也无法适配绝大多数工业应用场景。
3、申请号为cn 201310017954.9的中国专利申请公布了一种基于云计算环境的蚁群优化计算资源分配方法,基于云计算环境特点,预测潜在可用节点计算质量,分析网络带宽占用、线路质量、响应时间、任务费用、可靠性等因素对资源分配的影响,利用蚁群算法得到最终的最优化计算资源。无法准确跟踪实时操作系统下非以太网网络数据的流向与通讯波动情况,限制了其在实际工业现场的应用场景。
技术实现思路
1、本发明要解决的技术问题是:现有的工业现场网络检查方案无法适配实际工业现场的应用场景。
2、为了解决上述技术问题,本发明的技术方案是提供了一种工业现场网络故障自适应链路检查及恢复方法,其特征在于,包括以下步骤:
3、步骤1、根据底层的工业现场设备间通讯链路网络拓扑结构,采集始终确认状态数据完整性系统内部报告,完成对设备间数据到达情况的故障评估;
4、步骤2、除设备最前端模拟量采集设备,参与到的边缘计算的数据采集/汇集设备支持被抽象为一个定期采样数据包与后级虚拟化设备通讯形成一个微虚拟化计算节点;
5、步骤3、工业通讯系统支持实时时钟,能在通讯链路网络拓扑结构中的各个通讯节点之间判断数据交互延时是否符合既定要求,其中,一个微虚拟化计算节点可以由采用不同通讯方法的多个通讯节点汇集在一个设备内构成;
6、步骤4、当检测到某一通讯节点或某一链路间通信延期超过阈值,触发系统自检流程;
7、步骤5、内网状态时,所有参与计算的工业计算节点优化方法描述如下,其中,所有参与计算的工业计算节点支持虚拟化,进一步包括中心节点以及边缘计算节点:
8、步骤501、中心节点在收到故障预警后,根据历史上报传输路径或初始化设定传输路径对比设备间延时及周期性丢包情况确定预期故障点;对于通讯到预期故障点的边缘计算节点,下发算力切换自评估申请,发起算力估算调整;边缘计算节点根据自己与底层设备通讯情况以及与上层设备通讯情况,生成并上报中心节点相关数据,中心节点在汇集下发过算力切换自评估申请的边缘计算节点的数据后进行步骤502;
9、步骤502、将信号传输与运算过程至中心节点汇总抽象为一个有向单源最短路径评估问题,如下式所示:
10、min{(ta+la)*getstep(mcpa),(tb+lb)*getstep(mcpb),…,(tn+ln)*getstep(mcpn)}
11、式中:ta表示边缘计算节点a的传输时间延迟;la表示边缘计算节点a中整合数据的时间延迟;mcpa表示边缘计算节点a的本机最大算力;getstep函数定义为一旦内部应用超限则返回0值,则该评估恢复路径判定为失效;
12、步骤503、采用蚁群运算求解上述有向单源最短路径评估问题后,记录传输最近节点v的整合数据的时间延迟ln建立一个加权矩阵g,g=(v,e),对于每一条传输路径存在(u,v)具有权重w(u,v),其中,u为顶点;
13、步骤504、设集合q=v,从集合q中取出具有最小d值的顶点u,并将顶点u添加到集合s1中,集合s1为数据起始点集合,对于不在集合s1中的顶点u的每个邻居v,更新d(v)=min(d(v,d(u))+w(u,v)),d(v)为任意传输节点从数据起始点到v的最短距离,即各个节点上报的时间延迟ln,并相应地调整其在集合q中的位置,直到集合q的运算集为空,算法终止,d(v)的最终值是从集合s1中的顶点u到所有其他顶点的最短距离,此时记录下集合s1的所有传输路径以及算力分配;
14、步骤505、对边缘计算节点下发包含传输路径调整信息、信息汇总方式、算力拆分配置以及全网恢复同步时间信息,等待有关数据节点完成配置再入网;
15、步骤6、广播下发调整通讯路径及新的算力分布,数据库上传分布拓扑,广播数据包含在某一具体时间完成切换,完成后再次周期性上报步骤1的有关数据,并尝试对外网呼叫运维人员上报本次异常切换状态;
16、步骤7、切换网络后保持对故障线路最低限度的步骤1所记载的相关检测,一旦回复达到阈值可申请回复原默认网络,重复步骤6完成回复切换动作;
17、步骤10、一段时间后确认原有通信链路和边缘计算设备基本不变的情况下记录此次自适应调节系统算力调整并录入数据库为运维人员争取排查系统时间。
18、优选地,步骤1中,所述状态数据包括网络心跳、对时精度校准、设备周期性上报报文达成率。
19、优选地,步骤4中,所述自检流程包括
20、自检流程一:内部上报或通过心跳检测各个设备间数据延时及周期性丢包率统计,通过延时周期和报文大小确定所有参与计算的工业计算节点间路径参数;
21、自检流程二:内部统计涉及该超阈值设备需要的算力及当前算力以及相关算法在系统中的布局工业计算节点负荷情况,各工业计算节点上报算力余量作为跳转权重。
22、优选地,工业计算节点可由多个通讯节点汇集成为一个边缘计算节点实体设备安装在现场本地。
23、优选地,步骤501中,下发算力切换自评估申请时,如果涉及多个边缘计算节点,则发起多个算力估算申请。
24、优选地,步骤504中,记录下集合s1的所有传输路径以及算力分配时,若遇到多个设备调整,则将算力按线性进行累加再分配作为均衡处理。
25、本发明的另一个技术方案是提供了一种上述的工业现场网络故障自适应链路检查及恢复方法的应用,其特征在于,适用于主流工控应用场景扩展。
26、本发明的另一个技术方案是提供了一种上述的工业现场网络故障自适应链路检查及恢复方法的应用,其特征在于,与现场运维系统自动化分析装置(专利公开号:cn114979835a)所提供的运维功能匹配。
27、本发明在常规的计算机抽象中引入数据来源(数据量)和数据转换计算系数(耗费计算资源打包与时间戳标定),将数据采样与传输过程进行抽象加入算力参数中,结合各个传输节点中的网络传输延时,最终完成通讯链路异常后的算力与采样通道再分配,实现有限时间内的工业通讯系统自适应恢复与故障上报。本发明通过在线评估实时工业现场通讯网络故障状态,利用冗余网络及系统虚拟化再分配算力技术达到系统通讯链路再平衡,为后期运维人员抵达现场恢复系统时间。
1.一种工业现场网络故障自适应链路检查及恢复方法,其特征在于,包括以下步骤:
2.如权利要求1所述的一种工业现场网络故障自适应链路检查及恢复方法,其特征在于,步骤1中,所述状态数据包括网络心跳、对时精度校准、设备周期性上报报文达成率。
3.如权利要求1所述的一种工业现场网络故障自适应链路检查及恢复方法,其特征在于,步骤4中,所述自检流程包括
4.如权利要求1所述的一种工业现场网络故障自适应链路检查及恢复方法,其特征在于,工业计算节点可由多个通讯节点汇集成为一个边缘计算节点实体设备安装在现场本地。
5.如权利要求1所述的一种工业现场网络故障自适应链路检查及恢复方法,其特征在于,步骤501中,下发算力切换自评估申请时,如果涉及多个边缘计算节点,则发起多个算力估算申请。
6.如权利要求1所述的一种工业现场网络故障自适应链路检查及恢复方法,其特征在于,步骤504中,记录下集合s1的所有传输路径以及算力分配时,若遇到多个设备调整,则将算力按线性进行累加再分配作为均衡处理。
7.一种如权利要求1所述的工业现场网络故障自适应链路检查及恢复方法的应用,其特征在于,适用于主流工控应用场景扩展。
8.一种如权利要求1所述的工业现场网络故障自适应链路检查及恢复方法的应用,其特征在于,与现场运维系统自动化分析装置所提供的运维功能匹配。