本公开涉及数据备份,具体地,涉及一种数据中心数据备份容灾智能管控平台及方法。
背景技术:
1、在当今的信息时代,数据中心扮演着至关重要的角色,它们是企业运营的核心。随着数据量的激增和数据类型的多样化,数据备份和灾难恢复变得尤为重要,数据备份和容灾已成为企业确保业务连续性和数据完整性的关键任务。
2、然而,传统的数据备份方法通常基于预定义的规则和手动操作,由于规则是由不同的人员或团队手动创建和维护的,因此备份策略可能因数据源、数据类型和业务需求而异,这可能会导致数据保护级别不一致,从而增加数据丢失或损坏的风险。并且,手动备份操作既耗时又容易出错。随着数据量的不断增长,手动备份难以适应实际需求,这可能会导致备份任务延迟或失败。
3、此外,在数据备份过程中,由于关键数据对于业务运营至关重要,需要频繁备份和快速恢复。非关键数据虽然不太重要,但仍需要备份以满足法规遵从性或其他任务要求。但传统的数据备份策略无法识别出备份数据的类别是关键数据还是非关键数据,从而导致不必要的存储和带宽消耗,这使得传统的备份策略已经无法满足对不同类型数据的个性化备份需求。
4、因此,期望一种数据中心数据备份容灾智能管控平台。
技术实现思路
1、提供该
技术实现要素:
部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该发明内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
2、第一方面,本公开提供了一种数据中心数据备份容灾智能管控平台,所述平台包括:
3、数据采集模块,用于获取待备份数据;
4、文本和属性部分提取模块,用于提取所述待备份数据的属性特征以及从所述待备份数据中提取文本描述部分,其中,所述属性特征包括数据类型、数据大小、数据访问频率、数据修改频率和数据所有者;
5、属性特征语义编码模块,用于对所述待备份数据的属性特征进行属性特征语义理解和上下文编码以得到待备份数据属性特征语义编码特征向量;
6、文本描述语义编码模块,用于对所述文本描述部分进行语义编码以得到待备份数据内容语义编码特征向量;
7、数据多模态语义表征模块,用于使用语义元素级融合模块对所述待备份数据内容语义编码特征向量和所述待备份数据属性特征语义编码特征向量进行处理以得到待备份数据多模态语义表征特征向量作为待备份数据多模态语义表征特征;
8、数据类型检测和备份模块,用于基于所述待备份数据多模态语义表征特征,确定数据类型标签,并为所述待备份数据指定备份策略。
9、可选地,所述属性特征语义编码模块,用于:对所述待备份数据的属性特征分别进行独热编码后通过基于转换器结构的上下文编码器以得到所述待备份数据属性特征语义编码特征向量。
10、可选地,所述文本描述语义编码模块,用于:对所述文本描述部分进行分词处理以将所述文本描述部分转化为由多个词组成的词序列;将所述词序列中各个词映射到词向量以获得词向量的序列;以及,对所述词向量的序列进行基于全局的上下文语义编码以获得所述待备份数据内容语义编码特征向量。
11、可选地,所述数据多模态语义表征模块,用于:使用所述语义元素级融合模块对所述待备份数据内容语义编码特征向量和所述待备份数据属性特征语义编码特征向量以如下语义元素融合公式进行处理以得到所述待备份数据多模态语义表征特征向量;其中,所述语义元素融合公式为:
12、
13、其中,和分别是所述语义元素级融合模块对所述待备份数据内容语义编码特征向量和所述待备份数据属性特征语义编码特征向量,vg是所述待备份数据多模态语义表征特征向量,concat(·,·)表示向量的级联,t是门限值,t∈[0,1],wg是变换矩阵,b是偏置向量,sigmoid表示激活函数。
14、可选地,所述数据类型检测和备份模块,包括:数据类型识别单元,用于将所述待备份数据多模态语义表征特征向量通过基于分类器的数据识别器以得到识别结果,所述识别结果用于表示数据类型标签;数据备份策略制定单元,用于基于所述识别结果,为所述待备份数据指定备份策略。
15、可选地,还包括用于对所述基于转换器结构的上下文编码器、所述语义元素级融合模块和所述基于分类器的数据识别器进行训练的训练模块。
16、可选地,所述训练模块,包括:训练数据采集单元,用于获取训练待备份数据;训练文本和属性部分提取单元,用于提取所述训练待备份数据的训练属性特征以及从所述训练待备份数据中提取训练文本描述部分,其中,所述训练属性特征包括训练数据类型、训练数据大小、训练数据访问频率、训练数据修改频率和训练数据所有者;训练属性特征语义编码单元,用于对所述训练待备份数据的训练属性特征进行属性特征语义理解和上下文编码以得到训练待备份数据属性特征语义编码特征向量;训练文本描述语义编码单元,用于对所述训练文本描述部分进行语义编码以得到训练待备份数据内容语义编码特征向量;训练数据多模态语义表征单元,用于使用所述语义元素级融合模块对所述训练待备份数据内容语义编码特征向量和所述训练待备份数据属性特征语义编码特征向量进行处理以得到训练待备份数据多模态语义表征特征向量;训练优化单元,用于对所述训练待备份数据多模态语义表征特征向量进行聚类优化以得到优化训练待备份数据多模态语义表征特征向量;训练分类单元,用于将所述优化训练待备份数据多模态语义表征特征向量通过所述基于分类器的数据识别器以得到分类损失函数值;训练单元,用于基于所述分类损失函数值对所述基于转换器结构的上下文编码器、所述语义元素级融合模块和所述基于分类器的数据识别器进行训练。
17、可选地,所述训练优化单元,用于:对所述训练待备份数据多模态语义表征特征向量的各个特征值进行基于特征值间距离的聚类以得到聚类特征集合;基于所述聚类特征集合,对所述训练待备份数据多模态语义表征特征向量进行基于聚类后的特征类内和类外表征优化以得到所述优化训练待备份数据多模态语义表征特征向量。
18、第二方面,本公开提供了一种数据中心数据备份容灾智能管控方法,所述方法包括:
19、获取待备份数据;
20、提取所述待备份数据的属性特征以及从所述待备份数据中提取文本描述部分,其中,所述属性特征包括数据类型、数据大小、数据访问频率、数据修改频率和数据所有者;
21、对所述待备份数据的属性特征进行属性特征语义理解和上下文编码以得到待备份数据属性特征语义编码特征向量;
22、对所述文本描述部分进行语义编码以得到待备份数据内容语义编码特征向量;
23、使用语义元素级融合模块对所述待备份数据内容语义编码特征向量和所述待备份数据属性特征语义编码特征向量进行处理以得到待备份数据多模态语义表征特征向量作为待备份数据多模态语义表征特征;
24、基于所述待备份数据多模态语义表征特征,确定数据类型标签,并为所述待备份数据指定备份策略。
25、可选地,对所述待备份数据的属性特征进行属性特征语义理解和上下文编码以得到待备份数据属性特征语义编码特征向量,包括:对所述待备份数据的属性特征分别进行独热编码后通过基于转换器结构的上下文编码器以得到所述待备份数据属性特征语义编码特征向量。
26、采用上述技术方案,通过提取待备份数据的属性特征以及从待备份数据中提取文本描述部分;对待备份数据的属性特征进行属性特征语义理解和上下文编码以得到待备份数据属性特征语义编码特征向量;对文本描述部分进行语义编码以得到待备份数据内容语义编码特征向量;使用语义元素级融合模块对待备份数据内容语义编码特征向量和待备份数据属性特征语义编码特征向量进行处理以得到待备份数据多模态语义表征特征,以确定数据类型标签,并为待备份数据指定备份策略。这样,能够更加智能化地管理数据备份过程,提高数据备份的准确性和效率,为数据中心的稳定运行和灾难恢复提供更可靠的保障。
27、本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
1.一种数据中心数据备份容灾智能管控平台,其特征在于,包括:
2.根据权利要求1所述的数据中心数据备份容灾智能管控平台,其特征在于,所述属性特征语义编码模块,用于:对所述待备份数据的属性特征分别进行独热编码后通过基于转换器结构的上下文编码器以得到所述待备份数据属性特征语义编码特征向量。
3.根据权利要求2所述的数据中心数据备份容灾智能管控平台,其特征在于,所述文本描述语义编码模块,用于:
4.根据权利要求3所述的数据中心数据备份容灾智能管控平台,其特征在于,所述数据多模态语义表征模块,用于:使用所述语义元素级融合模块对所述待备份数据内容语义编码特征向量和所述待备份数据属性特征语义编码特征向量以如下语义元素融合公式进行处理以得到所述待备份数据多模态语义表征特征向量;
5.根据权利要求4所述的数据中心数据备份容灾智能管控平台,其特征在于,所述数据类型检测和备份模块,包括:
6.根据权利要求5所述的数据中心数据备份容灾智能管控平台,其特征在于,还包括用于对所述基于转换器结构的上下文编码器、所述语义元素级融合模块和所述基于分类器的数据识别器进行训练的训练模块。
7.根据权利要求6所述的数据中心数据备份容灾智能管控平台,其特征在于,所述训练模块,包括:
8.根据权利要求7所述的数据中心数据备份容灾智能管控平台,其特征在于,所述训练优化单元,用于:
9.一种数据中心数据备份容灾智能管控方法,其特征在于,包括:
10.根据权利要求9所述的数据中心数据备份容灾智能管控平台,其特征在于,对所述待备份数据的属性特征进行属性特征语义理解和上下文编码以得到待备份数据属性特征语义编码特征向量,包括:对所述待备份数据的属性特征分别进行独热编码后通过基于转换器结构的上下文编码器以得到所述待备份数据属性特征语义编码特征向量。
