本发明涉及孪生建模的,尤其涉及一种多维立体分析的孪生建模方法。
背景技术:
1、随着互联网、物联网等技术的发展,数据的产生和积累呈现出爆炸式增长的趋势。这些数据往往包含了来自不同来源、不同领域的信息,具有高度的复杂性和多样性。传统的分析方法往往是单一维度的,无法充分挖掘数据中的潜在信息,也无法从多个角度全面理解数据的特征和关系。多维立体分析则通过将数据从不同维度进行组合和分析,可以更加全面地理解数据的内在结构和规律,从而为决策提供更加准确的支持。然而,即使采用多维立体分析,由于数据的复杂性和多样性,单一的分析模型往往无法很好地适应不同类型的数据。针对该问题,本发明提出一种多维立体分析的孪生建模方法,通过训练多个相似但独立的孪生模型来处理不同数据,提取数据多维特征,降低单一模型的偏差,提高数字模型准确性。
技术实现思路
1、有鉴于此,本发明提供一种多维立体分析的孪生建模方法,目的在于:1)结合不同维度的样本相关性计算得到不同维度的距离权重,实现多维度运行数据的距离计算处理,从而计算得到不同运行数据的局部密度,局部密度越多,则邻近的运行数据数目越多,实现系统运行数据的分簇处理,将不同维度数据相似的运行数据划分到同一个系统运行簇,对系统运行簇内不同维度的关键信息特征,对系统运行数据进行关键维度提取,作为当前系统运行簇的关键维度,实现关键维度确定;2)基于关键维度所对应运行数据的分布特性以及迭代步长进行模型参数迭代,结合时序信息,对不同系统运行簇中关键维度所对应的系统运行数据进行时序建模,并基于关键维度所构建得到的时序模型对簇内其他维度进行孪生建模,将在关键维度对应的模型参数自适应迁移到簇内其他维度,实现结合关键维度模型参数的多维度模型参数孪生映射处理,对同一系统运行簇内不同维度对应的模型参数进行相似性度量,将相似性超过指定阈值的模型参数剔除,并对当前所有模型参数进行整合,得到不同维度系统运行数据的孪生建模结果,实现基于孪生模型参数的系统内立体数据预测。
2、实现上述目的,本发明提供的一种多维立体分析的孪生建模方法,包括以下步骤:
3、s1:采集不同维度的系统运行数据,基于不同维度之间的样本相关性,将所采集的系统运行数据进行分簇处理,得到多个系统运行簇;
4、s2:对系统运行簇内的系统运行数据进行关键维度提取,作为当前系统运行簇的关键维度;
5、s3:对不同系统运行簇中关键维度所对应的系统运行数据进行时序建模,并基于关键维度所构建得到的时序模型对簇内其他维度进行孪生建模,将在关键维度对应的模型参数自适应迁移到簇内其他维度;
6、s4:对同一系统运行簇内不同维度对应的模型参数进行相似性度量,将相似性超过指定阈值的模型参数剔除,并对当前所有模型参数进行整合,得到不同维度系统运行数据的孪生建模结果。
7、作为本发明的进一步改进方法:
8、可选地,所述s1步骤中采集不同维度的系统运行数据,包括:
9、采集不同维度的系统运行数据,其中所采集系统运行数据的表示形式为:
10、;
11、其中:
12、表示所采集系统在第n个时刻的运行数据,n表示所采集运行数据的总数;
13、表示运行数据中d个维度的系统运行值,表示运行数据中第d个维度的系统运行值,,d表示维度总数;
14、基于不同维度之间的样本相关性,将所采集的系统运行数据进行分簇处理,得到k个系统运行簇,其中每个系统运行簇中包含多个时刻的运行数据,k表示预设的系统运行簇总数。
15、可选地,所述基于不同维度之间的样本相关性,将所采集的系统运行数据进行分簇处理,包括:
16、基于不同维度之间的样本相关性,将所采集的系统运行数据进行分簇处理,得到k个系统运行簇,其中系统运行数据的分簇处理流程为:
17、s11:计算得到不同维度之间的样本相关性,其中第d个维度与第m个维度之间的样本相关性为:
18、;
19、其中:
20、表示第d个维度与第m个维度之间的样本相关性,;
21、s12:基于不同维度之间的样本相关性,计算得到不同维度的距离权重,其中第d个维度的距离权重为:
22、;
23、其中:
24、表示第d个维度的距离权重;
25、表示以自然常数为底的指数函数;
26、表示第d个维度与其他维度之间的样本相关性均值;
27、表示相关调节系数;
28、s13:基于不同维度的距离权重,计算得到系统运行数据中不同时刻所对应运行数据之间的距离,其中运行数据与运行数据之间的距离为:
29、;
30、其中:
31、表示运行数据与运行数据之间的距离;
32、s14:计算得到不同运行数据的局部密度,其中运行数据的局部密度为:
33、;
34、其中:
35、表示运行数据的局部密度,表示预设的距离阈值;
36、s15:计算得到不同运行数据的相对距离,其中运行数据的相对距离为:
37、;
38、其中:
39、表示运行数据的相对距离;
40、表示预设的最大相对距离;
41、e表示局部密度大于的任意运行数据,表示运行数据e与运行数据的距离,表示局部密度大于的任意运行数据中,运行数据与运行数据的最近距离;
42、s16:计算得到不同运行数据的聚类信息,其中运行数据的聚类信息为;
43、s17:选取k个聚类信息最大的运行数据作为k个系统运行簇的簇中心,其中k表示系统运行簇的数目,将非簇中心的运行数据合并至距离最近的簇中心所在的系统运行簇中;
44、其中k个系统运行簇的表示形式为:
45、;
46、其中:
47、表示第k个系统运行簇,表示第k个系统运行簇中的组运行数据,表示第k个系统运行簇内的运行数据总数。
48、可选地,所述s2步骤中对系统运行簇内的系统运行数据进行关键维度提取,包括:
49、对系统运行簇内的系统运行数据进行关键维度提取,其中第k个系统运行簇的关键维度提取流程为:
50、s21:计算得到第k个系统运行簇中每个维度的关键信息特征,其中第d个维度的关键信息特征为:
51、;
52、其中:
53、表示第k个系统运行簇中第d个维度的关键信息特征;
54、表示第k个系统运行簇中第组运行数据在第d个维度的系统运行值,;
55、表示系统运行值在第k个系统运行簇中的比值;
56、s22:计算得到第k个系统运行簇中每个维度的关键权重,其中第d个维度的关键权重为:
57、;
58、其中:
59、表示第k个系统运行簇中第d个维度的关键权重;
60、表示第k个系统运行簇中序列的标准差;
61、s23:比较第k个系统运行簇中每个维度的关键权重,并将关键权重最高的第个维度作为第k个系统运行簇的关键维度,其中。
62、可选地,所述s3步骤中对不同系统运行簇中关键维度所对应的系统运行数据进行时序建模,包括:
63、对不同系统运行簇中关键维度所对应的系统运行数据进行时序建模,其中第k个系统运行簇中关键维度所对应系统运行数据的时序建模流程为:
64、s31:获取第k个系统运行簇中关键维度所对应的系统运行数据:
65、;
66、其中:
67、表示第k个系统运行簇中关键维度所对应的系统运行数据;
68、s32:初始化生成第k个系统运行簇中关键维度对应的模型参数,并构建对应的训练目标函数:
69、;
70、其中:
71、表示所构建的第k个系统运行簇中关键维度对应的模型参数的训练目标数函数,表示第k个系统运行簇中关键维度所对应模型参数的第t次迭代结果,其中t的初始值为0,最大值为max;
72、表示系统运行值所对应的系统运行时刻;
73、表示基于模型参数预测得到的第个维度在系统运行时刻的时序预测值;
74、s33:对模型参数进行迭代,其中迭代公式为:
75、
76、
77、;
78、其中:
79、表示模型参数在t次迭代的均值;
80、t表示转置;
81、表示表征模型参数所对应训练目标函数值的变化步长;
82、表示步长控制参数;
83、表示单位矩阵;
84、表示l1范数;
85、表示第t次迭代的协方差参数,表示模型参数的迭代分布参数,表示期望为0,方差为的正态分布,表示服从正态分布的随机变量;
86、表示分布控制参数;
87、s34:令t=t+1,返回步骤s33,直到达到最大迭代次数,并将达到最大迭代次数的模型参数作为第k个系统运行簇中关键维度所对应的模型参数;
88、基于关键维度所构建得到的时序模型对簇内其他维度进行孪生建模,将在关键维度对应的模型参数自适应迁移到簇内其他维度。
89、可选地,所述基于关键维度所构建得到的时序模型对簇内其他维度进行孪生建模,将在关键维度对应的模型参数自适应迁移到簇内其他维度,包括:
90、基于关键维度所构建得到的时序模型对簇内其他维度进行孪生建模,将在关键维度对应的模型参数自适应迁移到簇内其他维度,其中第k个系统运行簇中第s个维度的模型参数为:
91、;
92、其中:
93、表示第k个系统运行簇中第s个维度的模型参数;
94、表示第k个系统运行簇中第个维度的关键信息特征,表示第k个系统运行簇中第s个维度的关键信息特征;
95、第k个系统运行簇中第s个维度所对应的系统运行数据。
96、可选地,所述s4步骤中对同一系统运行簇内不同维度对应的模型参数进行相似性度量,将相似性超过指定阈值的模型参数剔除,包括:
97、对同一系统运行簇内不同维度对应的模型参数进行相似性度量,其中第k个系统运行簇中模型参数的相似性度量公式为:
98、;
99、其中:
100、表示第k个系统运行簇中模型参数的相似性;
101、表示l2范数;
102、将每个系统运行簇中相似性超过指定阈值的模型参数剔除;
103、对当前所有模型参数进行整合,得到不同维度系统运行数据的孪生建模结果。
104、可选地,所述对当前所有模型参数进行整合,得到不同维度系统运行数据的孪生建模结果,包括:
105、对当前所有模型参数进行整合,得到不同维度系统运行数据的孪生建模结果,其中模型参数的整合流程为:
106、s41:获取当前所保留不同维度的模型参数,并构成模型参数集合,其中第d个维度的模型参数集合为;
107、s42:构建得到不同维度系统运行数据的孪生模型参数,其中第d个维度所对应系统运行数据的孪生模型参数为:
108、;
109、其中:
110、表示第d个维度所对应系统运行数据的孪生模型参数;
111、表示模型参数集合中模型参数的数目;
112、,表示模型参数集合中的任意模型参数,表示模型参数在其所对应系统运行簇中的关键权重;
113、s43:利用孪生模型参数进行不同系统运行时刻time的立体数据预测,其中第d个维度在系统运行时刻time的系统运行值预测结果为:
114、;
115、其中:
116、表示第d个维度在系统运行时刻time的系统运行值预测结果;
117、将d个维度的系统运行值预测结果作为基于孪生模型参数的立体数据预测结果。
118、为了解决上述问题,本发明提供一种电子设备,所述电子设备包括:
119、存储器,存储至少一个指令;
120、通信接口,实现电子设备通信;及
121、处理器,执行所述存储器中存储的指令以实现上述所述的多维立体分析的孪生建模方法。
122、为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个指令,所述至少一个指令被电子设备中的处理器执行以实现上述所述的多维立体分析的孪生建模方法。
123、相对于现有技术,本发明提出一种多维立体分析的孪生建模方法,该技术具有以下优势:
124、首先,本方案提出一种多维系统运行数据的分簇以及关键维度计算方式,计算得到不同运行数据的局部密度,其中运行数据的局部密度为:
125、;
126、其中:表示运行数据的局部密度,表示预设的距离阈值;计算得到不同运行数据的相对距离,其中运行数据的相对距离为:
127、
128、其中:表示运行数据的相对距离;表示预设的最大相对距离;e表示局部密度大于的任意运行数据,表示运行数据e与运行数据的距离,表示局部密度大于的任意运行数据中,运行数据与运行数据的最近距离;计算得到不同运行数据的聚类信息,其中运行数据的聚类信息为;选取k个聚类信息最大的运行数据作为k个系统运行簇的簇中心,其中k表示系统运行簇的数目,将非簇中心的运行数据合并至距离最近的簇中心所在的系统运行簇中;其中k个系统运行簇的表示形式为:
129、;
130、其中:表示第k个系统运行簇,表示第k个系统运行簇中的组运行数据,表示第k个系统运行簇内的运行数据总数。对系统运行簇内的系统运行数据进行关键维度提取,其中第k个系统运行簇的关键维度提取流程为:计算得到第k个系统运行簇中每个维度的关键信息特征,其中第d个维度的关键信息特征为:
131、;
132、其中:表示第k个系统运行簇中第d个维度的关键信息特征;表示第k个系统运行簇中第组运行数据在第d个维度的系统运行值,;表示系统运行值在第k个系统运行簇中的比值;计算得到第k个系统运行簇中每个维度的关键权重,其中第d个维度的关键权重为:
133、
134、其中:表示第k个系统运行簇中第d个维度的关键权重;表示第k个系统运行簇中序列的标准差;比较第k个系统运行簇中每个维度的关键权重,并将关键权重最高的第个维度作为第k个系统运行簇的关键维度,其中。本方案结合不同维度的样本相关性计算得到不同维度的距离权重,实现多维度运行数据的距离计算处理,从而计算得到不同运行数据的局部密度,局部密度越多,则邻近的运行数据数目越多,实现系统运行数据的分簇处理,将不同维度数据相似的运行数据划分到同一个系统运行簇,对系统运行簇内不同维度的关键信息特征,对系统运行数据进行关键维度提取,作为当前系统运行簇的关键维度,实现关键维度确定。
135、同时,本方案提出一种多维度模型参数的孪生映射生成方法,初始化生成第k个系统运行簇中关键维度对应的模型参数,并构建对应的训练目标函数:
136、;
137、其中:表示所构建的第k个系统运行簇中关键维度对应的模型参数的训练目标数函数,表示第k个系统运行簇中关键维度所对应模型参数的第t次迭代结果,其中t的初始值为0,最大值为max;表示系统运行值所对应的系统运行时刻;表示基于模型参数预测得到的第个维度在系统运行时刻的时序预测值;对模型参数进行迭代,其中迭代公式为:
138、
139、
140、;
141、其中:表示模型参数在t次迭代的均值;t表示转置;表示表征模型参数所对应训练目标函数值的变化步长;表示步长控制参数;表示单位矩阵;表示l1范数;表示第t次迭代的协方差参数,表示模型参数的迭代分布参数,表示期望为0,方差为的正态分布,表示服从正态分布的随机变量;表示分布控制参数;令t=t+1,直到达到最大迭代次数,并将达到最大迭代次数的模型参数作为第k个系统运行簇中关键维度所对应的模型参数;基于关键维度所构建得到的时序模型对簇内其他维度进行孪生建模,将在关键维度对应的模型参数自适应迁移到簇内其他维度,其中第k个系统运行簇中第s个维度的模型参数为:
142、;
143、其中:表示第k个系统运行簇中第s个维度的模型参数;表示第k个系统运行簇中第个维度的关键信息特征,表示第k个系统运行簇中第s个维度的关键信息特征;第k个系统运行簇中第s个维度所对应的系统运行数据。本方案基于关键维度所对应运行数据的分布特性以及迭代步长进行模型参数迭代,结合时序信息,对不同系统运行簇中关键维度所对应的系统运行数据进行时序建模,并基于关键维度所构建得到的时序模型对簇内其他维度进行孪生建模,将在关键维度对应的模型参数自适应迁移到簇内其他维度,实现结合关键维度模型参数的多维度模型参数孪生映射处理,对同一系统运行簇内不同维度对应的模型参数进行相似性度量,将相似性超过指定阈值的模型参数剔除,并对当前所有模型参数进行整合,得到不同维度系统运行数据的孪生建模结果,实现基于孪生模型参数的系统内立体数据预测。
1.一种多维立体分析的孪生建模方法,其特征在于,所述方法包括:
2.如权利要求1所述的一种多维立体分析的孪生建模方法,其特征在于,所述s1步骤中采集不同维度的系统运行数据,包括:
3.如权利要求2所述的一种多维立体分析的孪生建模方法,其特征在于,所述基于不同维度之间的样本相关性,将所采集的系统运行数据进行分簇处理,包括:
4.如权利要求3所述的一种多维立体分析的孪生建模方法,其特征在于,所述s2步骤中对系统运行簇内的系统运行数据进行关键维度提取,包括:
5.如权利要求1所述的一种多维立体分析的孪生建模方法,其特征在于,所述s3步骤中对不同系统运行簇中关键维度所对应的系统运行数据进行时序建模,包括:
6.如权利要求5所述的一种多维立体分析的孪生建模方法,其特征在于,所述基于关键维度所构建得到的时序模型对簇内其他维度进行孪生建模,将在关键维度对应的模型参数自适应迁移到簇内其他维度,包括:
7.如权利要求6所述的一种多维立体分析的孪生建模方法,其特征在于,所述s4步骤中对同一系统运行簇内不同维度对应的模型参数进行相似性度量,将相似性超过指定阈值的模型参数剔除,包括:
8.如权利要求7所述的一种多维立体分析的孪生建模方法,其特征在于,所述对当前所有模型参数进行整合,得到不同维度系统运行数据的孪生建模结果,包括: