一种基于BERT模型的命名实体识别方法与流程

专利2025-12-03  11


本发明涉及工业互联网,尤其涉及一种基于bert模型的命名实体识别方法。


背景技术:

1、随着工控防御技术和攻击技术交替提升,工控安全防护由最初的被动防御逐渐过渡到主动防御。蜜罐即是一种主动防御技术,本质是一种欺骗、引诱方法,其价值在于被攻击,从而达到保护真实系统不被攻击的目的。蜜罐识别是攻击方为了能够准确攻击到真实的工控设备对应的系统而采取的措施。虽然工控蜜罐具有伪装性,但蜜罐仍可能被攻击者识别出来,导致蜜罐失效。为提高工控蜜罐的真实性,增强蜜罐抗识别能力,工控蜜罐识别研究非常必要。当前主要依赖人工经验对待识别的信息进行筛选,得到可能存在工控蜜罐特征的信息,并进一步提升蜜罐识别模型对蜜罐特征进行蜜罐识别的准确性,以提升蜜罐识别的效率。

2、但是,基于人工进行筛选得到的工控蜜罐信息的准确性和效率并不高。由此,仅通过提升蜜罐识别模型对蜜罐特征的预测能力,在提升蜜罐识别的效率上的效果有限。


技术实现思路

1、本发明提供一种基于bert模型的命名实体识别方法,用以解决现有技术中蜜罐识别效率较低的问题

2、本发明提供一种基于bert模型的命名实体识别方法,包括:

3、获取待识别的工控设备信息;

4、基于蜜罐实体识别bert模型对所述待识别的工控设备信息进行实体识别,得到候选工控蜜罐实体;所述蜜罐实体识别bert模型是基于样本工控设备信息进行训练得到的;

5、基于所述候选工控蜜罐实体,对所述待识别的工控设备信息进行工控蜜罐识别。

6、根据本发明提供的一种基于bert模型的命名实体识别方法,所述蜜罐实体识别bert模型的训练步骤,包括:

7、获取所述样本工控设备信息;

8、基于所述样本工控设备信息以及初始bert模型,训练得到所述蜜罐实体识别bert模型。

9、根据本发明提供的一种基于bert模型的命名实体识别方法,所述基于所述样本工控设备信息以及初始bert模型,训练得到所述蜜罐实体识别bert模型,包括:

10、对所述样本工控设备信息进行预处理操作,得到待标注设备信息;

11、对所述待标注设备信息进行实体标注,得到标注设备信息;

12、基于所述标注设备信息以及所述初始bert模型,训练得到所述蜜罐实体识别bert模型。

13、根据本发明提供的一种基于bert模型的命名实体识别方法,所述对所述样本工控设备信息进行预处理操作,得到待标注设备信息,包括:

14、对所述样本工控设备信息进行筛选,得到筛选设备信息;

15、对所述筛选设备信息进行拆分和拼接,得到所述待标注设备信息。

16、根据本发明提供的一种基于bert模型的命名实体识别方法,所述对所述筛选设备信息进行拆分和拼接,得到所述待标注设备信息,包括:

17、对所述筛选设备信息进行句级分割,和/或,词级分割,得到分割设备信息;

18、对所述分割设备信息进行拼接,得到所述待标注设备信息。

19、根据本发明提供的一种基于bert模型的命名实体识别方法,所述对所述待标注设备信息进行实体标注,得到标注设备信息,包括:

20、对所述待标注设备信息进行实体类型以及实体位置标注,得到所述标注设备信息。

21、根据本发明提供的一种基于bert模型的命名实体识别方法,所述训练得到所述蜜罐实体识别bert模型,之后包括:

22、基于测试设备信息以及所述蜜罐实体识别bert模型,得到测试工控蜜罐实体;

23、基于所述测试工控蜜罐实体,以及所述测试设备信息的测试标签,确定所述蜜罐实体识别bert模型的测试评估结果。

24、本发明还提供一种基于bert模型的命名实体识别装置,包括:

25、获取单元,获取待识别的工控设备信息;

26、实体分类单元,基于蜜罐实体识别bert模型对所述待识别的工控设备信息进行实体识别,得到候选工控蜜罐实体;所述蜜罐实体识别bert模型是基于样本工控设备信息进行训练得到的;

27、工控蜜罐识别单元,基于所述候选工控蜜罐实体,对所述待识别的工控设备信息进行工控蜜罐识别。

28、本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一种所述一种基于bert模型的命名实体识别方法。

29、本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一种所述一种基于bert模型的命名实体识别方法。

30、本发明还提供一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现如上述任一种所述一种基于bert模型的命名实体识别方法。

31、本发明提供的一种基于bert模型的命名实体识别方法,通过引入命名实体识别得到蜜罐实体识别bert模型,对待识别的工控设备信息进行实体识别,得到与工控蜜罐特征相关的候选工控蜜罐实体,提升了进行工控蜜罐识别时提取特征的效率和准确性,进而提升进行工控蜜罐识别的效率和准确性。



技术特征:

1.一种基于bert模型的命名实体识别方法,其特征在于,包括:

2.根据权利要求1所述的一种基于bert模型的命名实体识别方法,其特征在于,所述蜜罐实体识别bert模型的训练步骤,包括:

3.根据权利要求2所述的一种基于bert模型的命名实体识别方法,其特征在于,所述基于所述样本工控设备信息以及初始bert模型,训练得到所述蜜罐实体识别bert模型,包括:

4.根据权利要求3所述的一种基于bert模型的命名实体识别方法,其特征在于,所述对所述样本工控设备信息进行预处理操作,得到待标注设备信息,包括:

5.根据权利要求4所述的一种基于bert模型的命名实体识别方法,其特征在于,所述对所述筛选设备信息进行拆分和拼接,得到所述待标注设备信息,包括:

6.根据权利要求3所述的一种基于bert模型的命名实体识别方法,其特征在于,所述对所述待标注设备信息进行实体标注,得到标注设备信息,包括:

7.根据权利要求2-6中任一项所述的一种基于bert模型的命名实体识别方法,其特征在于,所述训练得到所述蜜罐实体识别bert模型,之后包括:

8.一种基于bert模型的命名实体识别装置,其特征在于,包括:

9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至7任一项所述一种基于bert模型的命名实体识别方法。

10.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述一种基于bert模型的命名实体识别方法。


技术总结
本发明提供一种基于BERT模型的命名实体识别方法,方法包括:获取待识别的工控设备信息;基于蜜罐实体识别BERT模型对待识别的工控设备信息进行实体识别,得到候选工控蜜罐实体;蜜罐实体识别BERT模型是基于样本工控设备信息进行训练得到的;基于候选工控蜜罐实体,对待识别的工控设备信息进行工控蜜罐识别。本发明提供的方法,通过引入命名实体识别得到蜜罐实体识别BERT模型,对待识别的工控设备信息进行实体识别,得到与工控蜜罐特征相关的候选工控蜜罐实体,并基于候选工控蜜罐实体进行工控蜜罐识别,提升了进行工控蜜罐识别时提取特征的效率和准确性,进而提升进行工控蜜罐识别的效率和准确性。

技术研发人员:张立芳
受保护的技术使用者:中银金融科技有限公司
技术研发日:
技术公布日:2024/6/26
转载请注明原文地址:https://doc.8miu.com/read-1825434.html

最新回复(0)