本发明在分布式学习的基础上,构建了一种基于分布式时态图学习的工业互联网攻击检测方法。首先,在终端设备上使用多层自适应扩张卷积网络对多维时序数据提取时空特征,并构建图结构来表征不同维度数据的相互关系。然后基于图结构之间节点与边的距离进行图聚类,进一步压缩与中心计算节点的通信量。最后在中心计算节点实现节点连接关系更新动态图学习,实现网络攻击精确分类。这种基于分布式时态图学习的工业互联网攻击检测方法在实际工业互联网攻击检测建模过程中,可以解决由于工业过程中复杂高维数据导致的工业互联网中分布式学习建模效率低和通信消耗高的问题,实现了高精度攻击检测,为工业互联网行业提供技术支持。
背景技术:
1、随着工业互联网的迅速发展,分布式学习技术成为了研究和应用的焦点之一。智能设备、大数据分析等先进技术的广泛应用,使得生产系统的监测、控制、优化变得更加高效和智能化。然而,工业互联网的网络化、智能化使其面临着来自网络攻击的威胁,攻击者可能利用漏洞、恶意代码或其他手段入侵系统,导致生产中断、数据泄露甚至设备损坏,严重威胁到企业的运行安全和商业利益。同时,工业互联网的数据来自于多种源头,导致采集到的数据量大且高维,给基于数据驱动的分布式学习攻击检测带来了处理和分析的挑战。因此,本发明的研究成果在实际工业互联网领域具有广阔的应用前景。
2、传统分布式学习方法通常采用基于简单模型和算法的方式,将大规模数据分配到不同的节点上进行训练,然后将各节点的部分结果进行汇总,以构建整体模型。然而,这种方法在处理高维时态数据时往往表现不佳。在工业互联网环境中,数据通常呈现出高度复杂的特征,具有多维度和大量数据的特点,例如传感器数据、设备运行状态等。传统的分布式学习方法在处理这样的数据时会面临诸多挑战,包括通信开销大、模型精度低等问题。特别是在处理高维时态数据时,传统方法容易受限于通信量的增加和模型训练效率的降低。此外,由于工业数据的复杂性,不同维度数据之间可能存在着潜在的复杂关联关系,而传统方法往往难以充分利用这些关联信息,导致模型的泛化能力和精确度不足。因此,对于工业互联网领域而言,寻求一种能够有效处理大规模高维数据和减少通信开销的新方法具有重要的现实意义。
技术实现思路
1、本发明获得了一种基于分布式时态图学习的工业互联网攻击检测方法,该方法首先利用了多个边缘设备多层自适应提取本地高维时序数据并构建图结构,然后在边缘通过聚类得到具有表征能力的聚类特征图,最后在中心计算节点实现节点关系动态图学习,实现网络攻击精确分类。该方法在实际工业互联网攻击检测建模过程中实现高精度攻击检测,并且降低了通信成本成本。
2、本发明采用了如下的技术方案及实现步骤:
3、一种基于分布式时态图学习的工业互联网攻击检测方法,其特征在于,包括以下步骤:
4、(1)高维时序数据处理
5、①工业互联网系统配置k个终端设备;
6、②对所述①中的每一个终端设备设置n个传感器进行数据采集;
7、③终端设备采集含有攻击的工业互联网数据,采集到的数据集为其中第k个终端设备采集到的n维数据为为收集到的长度为τ数据,为对应标签;
8、④对所述③中的第k个终端设备采集到的n维数据dk按特征维度进行拼接,得到二维输入矩阵为inputk,尺寸为n×τ;
9、⑤对所述④中的数据dk中的进行归一化至[-1,1];
10、⑥对所述⑤中的数据集分成2组,分别作为训练集和测试集,训练集的样本与测试集的样本数的比例为4:1;
11、(2)终端设备构建时空特征提取网络
12、①在每个终端设备上构建一个4层扩张卷积网络,卷积核大小为5×5,在每一层网络训练的卷积过程中,使用扩张率d表示卷积核处理的数据间隔,其中间隔为d-1,第k个终端设备中的网络输入为inputk,第l层扩张率为:
13、
14、其中,是第k个终端设备中的第l层输入矩阵的相似度,计算公式为:
15、
16、其中,为第k个终端设备的第l层网络输入第a行第列的数值,a=1,......,n-1,为第k个终端设备的第l层网络输入第b行第列的数值,b=1,......,n,为取最大值;
17、②在第k个终端设备中提取时空特征公式为:
18、
19、其中,为第k个终端设备中第l层输出的第a′行第,列的数值,当l=4,为时空特征提取网络输出矩阵,λ=1,2,3,4,σ=1,2,3,4,为第k个终端设备中的第l层网络的输入对应运算的值,为第k个终端设备第l层网络中卷积核第λ行第σ列权重值;
20、③将第k个终端设备中网络输出矩阵构建设置为节点矩阵vk,尺寸为n×r,表示为n个节点,每个节点中特征数值长度为r;
21、④计算节点之间的相似度,计算公式为:
22、
23、其中,为节点i与节点j的相似度,i=1,......,n,j=1,…,n,而且i≠j,为第k个终端设备中节点矩阵的第i个节点的第r个的数值,为第k个终端设备中节点矩阵的第j个节点的第r+3个的数值,r=1,......,r-3;
24、⑤构建节点连接关系矩阵ek,尺寸为n×n,若节点i与节点j相似度属于前40%设置为连接,对应矩阵元素否则为不连接得到第k个终端设备的时空特征图fgk={vk,ek};
25、(3)边缘设备构建图聚合模型
26、①每个终端设备发送本地时空特征图到边缘设备中进行图聚合,其中目标函数为:
27、
28、其中,δ(·)为上传特征图到中央服务器所需的通信量,fgu为第u个终端设备的时空特征图,u=1,......,k,cfgv为聚合后的第v个的聚合特征图,m为聚合后聚合特征图的数量,设置为其中为向上取整数,v=1,......,m;
29、②计算第p个终端设备上传的特征图fgp和第q个终端设备上传的特征图fgq的距离d(p,q),首先转化和其中特征图fgp和特征图fgq边距离为:
30、
31、其中,π(p,q)为fgp和fgq节点分布集合,为第p个终端设备的特征图fgp中第i和i′个节点,i=1,......,n,i′=1,......,n,i≠i′,第q个终端设备的特征图fgq中第j和j′个节点,j=1,......,n,j′=1,......,n,j≠j′,tij为第p个终端设备上的节点i和第q个终端设备上节点j的匹配概率,c(·,·)为节点之间距离,计算公式为:
32、
33、其中,为余弦相似度计算函数,exp(·)为指数函数;
34、节点距离计算公式为:
35、
36、特征图fgp和特征图fgq的距离d(p,q)为:
37、
38、③根据d(p,q)对特征图进行层次聚类成m组,保留组内特征图的节点连接关系得到e′,并平均节点矩阵v′,得到m个聚合特征图cfg,其中第m个聚合特征图为将所有聚合特征图上传至中心计算节点;
39、(4)中心计算节点构建图分类网络模型
40、①接收边缘设备的聚合特征图cfg,并作为图分类网络输入,模型目标函数为:
41、
42、其中,θ为模型参数,为第k个边缘设备中第n个传感器采集到的数据,n=1,......,n,k=1,......,k,fθ(x)为网络模型输出,输出的设备的状态数量为7,为损失函数,公式为:
43、
44、其中,为第k个边缘设备中状态,如果设备真实状态是g,则否则等于0,为图神经网络模型输出是观察类别g的概率,log(·)是对数函数;
45、②构建以图神经网络为基础的分类网络,包括4层图卷积网络,卷积核大小为5×5,每层图卷积网络连接一个线性整流函数激活层,第2层和第3层图卷积之间加入图注意力层,输入特征维度为64,输出特征维度为64,第4层图卷积输出连接一个全连接层组成,全连接层有128个神经元;
46、③网络输入为输入为cfg={v′,e′},第l层图卷积输出公式为:
47、
48、其中,hl为第l-1层图卷积的输出,h1为输入的节点矩阵v′,relu(·)为一个线性整流函数激活层,为第l-1层权重矩阵,为的度矩阵,表示为:
49、
50、其中,i为单位矩阵,第4层网络输出为:
51、output=h4#(14)
52、④第2层和第3层图卷积之间构建节点连接关系更新模块,将需要计算的节点i和节点j在第2层输出的特征向量和进行拼接,节点之间的相关性系数为:
53、
54、其中,we为图注意力层权重矩阵,为注意力权重向量,leakyrelu(·)为带泄露修正线性单元,注意力相关系数αij为:
55、
56、⑤根据注意力相关系数αij更新节点连接关系矩阵,其公式为:
57、
58、⑥完成训练后将权重w={we,wg}发送到边缘服务器上;
59、(5)进行工业互联网攻击检测
60、在第k个边缘设备上检测攻击,得到预测标签矩阵
61、
62、其中,为预测标签矩阵,尺寸为n×1,xk为第k个边缘设备上采集到的数据集,尺寸为n×τ;
63、为第k个边缘设备上检测攻击的结果,完成工业互联网攻击检测。
64、本发明设计了一种基于分布式时态图学习的工业互联网攻击检测方法,实现工业互联网攻击检测。首先,终端设备构建时空特征提取网络,将采集到的高维时序转化为图结构。然后将采集到的图结构进行聚合,构建聚合特征图用于上传中央计算节点。中央计算节点进行边更新的全局图神经网络训练。该方法在实际分布式工业互联网中,实现高维时序信号的特征提取,提高攻击检测精度,实现了大规模高维数据处理、降低通信开销的攻击检测,为分布式工业互联网攻击检测提供一个有效方法。
1.一种基于分布式时态图学习的工业互联网攻击检测方法,其特征在于,包括以下步骤: