一种基于语义相似度的工程装备试验案例知识检索方法

专利2026-03-08  13


本发明涉及工程装备试验,更具体地说,本发明涉及一种基于语义相似度的工程装备试验案例知识检索方法。


背景技术:

1、工程装备试验是一种检验装备作战效能以及各类适用性指标的系统性活动,能够优化装备设及,方便对设备进行改进和改型,在进行工程装备试验前,需要对工程装备试验的大纲与设计方案进行知识检索,而考核设计方案以及设计方案涉及多学科知识具有知识领域交叉、多专业覆盖以及多层次知识叠加的特性,知识高度密集,其评价指标体系的构建困难,考核科目设计具有挑战性,目前的工程装备试验案例的知识检索依赖于专业人员的经验积累,辅以手册、图书等,缺乏对工程装备试验设计领域显性及隐形经验知识的规范化表示和检索重用,其检索效率低且检索难度大,本体是对特定领域内概念、术语及关系进行抽象而建立的一种形式化知识描述,能够实现领域内知识的规范化表示,在生物医药、工程以及运输等领域应用广泛,但是现有的知识检索中,还没有军事与本体结合的工程装备试验案例知识检索方法。为了解决上述问题,现提供一种技术方案。


技术实现思路

1、为了克服现有技术的上述缺陷,本发明提供一种基于语义相似度的工程装备试验案例知识检索方法,通过基于领域本体语义相似度进行知识检索分析计算,对工程装备试验设计领域显性及隐形经验知识进行规范化表示和检索重用,自动化实现工程装备试验案例知识检索,检索效率低且检索难度低,实现了军事与本体结合的工程装备试验案例知识检索。

2、为实现上述目的,本发明提供如下技术方案:

3、一种基于语义相似度的工程装备试验案例知识检索方法,包括如下步骤:

4、步骤一,构建工程装备试验案例本体;

5、步骤二,基于领域本体语义相似度进行知识检索分析计算,对领域本体语义相似度进行降序排序,获取领域本体语义相似度排名前5的案例;

6、步骤三,进行一次检索案例推送;

7、步骤四,捕捉推送的工程装备试验案例文档中的关键词,基于关键词同义扩展进行二次知识检索,进行二次检索案例推送;

8、在步骤二中,知识检索分析计算包括本体概念语义距离相似度计算、案例属性语义相似度计算以及领域本体语义相似度计算,利用本体概念语义距离相似度计算、案例属性语义相似度计算分别获取本体概念语义距离相似度和案例属性语义相似度,通过加权本体概念语义距离相似度和案例属性语义相似度获取领域本体语义相似度,通过领域本体语义相似度评估目标案例与候选案例的相似度,领域本体语义相似度的公式为:

9、s=ω1sg+ω2sp;

10、式中:s为领域本体语义相似度,sg为本体概念语义距离相似度,sp为案例属性语义相似度,ω1和ω2分别为本体概念语义距离相似度和案例属性语义相似度的权重。

11、作为本发明进一步的方案,在步骤一中,构建工程装备试验案例本体的流程包括:

12、步骤a1,确定知识本体专业领域及范畴:基于工程装备试验,选取其考核作业效能指标的对象为工程装备,确定构建的领域本体为工程装备类型;

13、步骤a2,复用现有知识本体:领域专家利用公开的工程兵专业领域公共知识库,获取装备试验历史试验方案,采集装备试验考核领域的概念术语集;

14、步骤a3,定义概念和概念之间的层次数据库体系,确定概念的属性,定义属性的约束,创建实例:利用采集的装备试验考核领域概念术语集,通过数据库技术依据工程装备的类型和型号进行层级划分,构建概念和概念之间的层次数据库体系,获取每个概念的属性集合,每个概念的属性集合为{案例类别,地理环境,列装部队类型,装备使用场景,功能部件},工程装备试验设计本体属性值类型均为实体,根据构建的本体模型,选择具体的类,创建该类的实例,明确属性值。

15、作为本发明进一步的方案,在步骤a3中,案例类别包括大纲和方案,地理环境包括高原、平原和濒海,列装部队类型包括工化旅和合成旅,装备使用场景包括水面、路上和两栖。

16、作为本发明进一步的方案,在步骤二中,本体概念语义距离相似度计算中,对目标案例和案例库中历史案例本体概念进行编号,本体概念语义距离相似度为本体概念深度与1之差的两倍,减去目标案例的概念值、案例库中历史案例对应编号概念值在本体结构层次中最短路径的欧式距离,再与本体概念深度与1之差两倍的比值,本体概念语义距离相似度的公式为:

17、

18、式中:dept(onto)为本体概念的深度,为概念节点与根节点的最短路径中所包含的边数,i为本体概念编号,分别为编号为i的目标案例和案例库中历史案例本体的概念,为概念和在本体结构层次中最短的欧式距离。

19、作为本发明进一步的方案,在本体概念语义距离相似度公式中,综合考虑语义路径距离和节点深度,本体概念的深度为概念和概念的节点深度之和,与1同概念概念节点深度之差绝对值之和的比值,本体概念的深度公式为:

20、

21、式中:分别为概念的节点深度、概念的节点深度。

22、作为本发明进一步的方案,在领域本体语义相似度的公式中,本体概念语义距离相似度的权重和案例属性语义相似度的权重的获取方法为:

23、步骤c1,采集本体概念语义距离相似度的权重影响数据和案例属性语义相似度的权重影响数据:本体概念语义距离相似度的权重影响数包括本体距离根节点的平均边数、领域专家需求设置值以及本体概念的应用需求评分,案例属性语义相似度的权重影响数据包括案例属性重要度评分、属性应用场景评分、用户需求反馈值以及业务规则约束值;

24、步骤c2,获取本体概念语义距离相似度权重影响系数和案例属性语义相似度权重影响系数:通过本体距离根节点的平均边数、领域专家需求设置值以及本体概念的应用需求评分获取本体概念语义距离相似度权重影响系数,通过案例属性重要度评分、属性应用场景评分、用户需求反馈值以及业务规则约束值获取案例属性语义相似度权重影响系数,其中,本体概念语义距离相似度权重影响系数与本体距离根节点的平均边数负相关,与领域专家需求设置值正相关,与本体概念的应用需求评分正相关,本体概念语义距离相似度权重影响系数的公式为:

25、

26、式中:α1为本体概念语义距离相似度权重影响系数,为本体距离根节点的平均边数,texpert为领域专家需求设置值,dxq为本体概念的应用需求评分,θ、μ、ρ均为数值在[1,10]之间的经验调整系数,根据历史数据的数值分析获得;

27、案例属性语义相似度权重影响系数与案例属性重要度评分正相关,与属性应用场景评分正相关,与用户需求反馈值正相关,与业务规则约束值负相关,案例属性语义相似度权重影响系数的公式为:

28、

29、式中:α2为案例属性语义相似度权重影响系数,dr为案例属性重要度评分,zfk为属性应用场景评分,yyw为用户需求反馈值,σ、v均为数值在[1,2]之间的经验调整系数,根据历史数据的数值分析获得;

30、步骤c3,获取本体概念语义距离相似度权重和案例属性语义相似度权重:本体概念语义距离相似度权重为本体概念语义距离相似度权重影响系数与案例属性语义相似度权重影响系数的比值乘以0.5,本体概念语义距离相似度权重的公式为案例属性语义相似度权重为1减去本体概念语义距离相似度权重,案例属性语义相似度权重为ω2=1-ω1。

31、作为本发明进一步的方案,在步骤二中,案例属性语义相似度计算中,将各个属性的权重乘以目标案例与历史案例相对应编号属性相似度的总和作为案例属性语义相似度,案例属性语义相似度的公式为:

32、

33、式中:j为属性编号,n为案例中属性的总个数,γj为编号为j的属性的权重,其中分别为目标案例和历史案例的第j个属性,为目标案例和历史案例第j个属性的相似度。

34、作为本发明进一步的方案,在案例属性语义相似度的公式中,目标案例和历史案例第j个属性的相似度为案例属性深度减去1的2倍,同目标案例和历史案例第j个属性在本体结构层次中最短路径欧式距离之差,再同案例属性深度减去1的2倍的比值,目标案例和历史案例第j个属性的相似度公式为:

35、

36、式中:dept(onto)′为案例属性深度,为案例属性节点与根节点的最短路径中所包含的边数,为目标案例第j个属性和历史案例第j个属性在本体结构层次中最短路径欧式距离。

37、作为本发明进一步的方案,在目标案例和历史案例第j个属性的相似度公式中,综合考虑案例属性路径距离和节点深度,案例属性深度为目标案例第j个属性和历史案例第j个属性的节点深度之和,与1同目标案例第j个属性历史案例第j个属性之差绝对值之和的比值,案例属性深度公式为:

38、

39、式中:分别为目标案例第j个属性和历史案例第j个属性的节点深度。

40、作为本发明进一步的方案,在步骤四中,捕捉推送的工程装备试验案例文档中的关键词,基于关键词同义扩展进行二次知识检索,进行二次检索案例推送的流程包括:

41、步骤b1,通过兼顾通用知识和专业领域知识的工程装备试验设计领域同意词库生成工程装备试验文本文件中关键词的扩展同义词集合;

42、步骤b2,基于lucence中文检索引擎进行同义扩展查询,检索一次推送中的案例;

43、步骤b3,对一次推送中的案例进行重排序,输出二次检索结果,进行二次检索案例推送。

44、本发明一种基于语义相似度的工程装备试验案例知识检索方法的技术效果和优点:本发明通过基于领域本体语义相似度进行知识检索分析计算,对工程装备试验设计领域显性及隐形经验知识进行规范化表示和检索重用,自动化实现工程装备试验案例知识检索,检索效率低且检索难度低,实现了军事与本体结合的工程装备试验案例知识检索,能够提高工程装备领域试验设计的效率和科学性。


技术特征:

1.一种基于语义相似度的工程装备试验案例知识检索方法,包括如下步骤:

2.根据权利要求1所述的一种基于语义相似度的工程装备试验案例知识检索方法,其特征在于,在步骤一中,构建工程装备试验案例本体的流程包括:

3.根据权利要求2所述的一种基于语义相似度的工程装备试验案例知识检索方法,其特征在于,在步骤a3中,案例类别包括大纲和方案,地理环境包括高原、平原和濒海,列装部队类型包括工化旅和合成旅,装备使用场景包括水面、路上和两栖。

4.根据权利要求1所述的一种基于语义相似度的工程装备试验案例知识检索方法,其特征在于,在步骤二中,本体概念语义距离相似度计算中,对目标案例和案例库中历史案例本体概念进行编号,本体概念语义距离相似度为本体概念深度与1之差的两倍,减去目标案例的概念值、案例库中历史案例对应编号概念值在本体结构层次中最短路径的欧式距离,再与本体概念深度与1之差两倍的比值,本体概念语义距离相似度的公式为:

5.根据权利要求4所述的一种基于语义相似度的工程装备试验案例知识检索方法,其特征在于,在本体概念语义距离相似度公式中,综合考虑语义路径距离和节点深度,本体概念的深度为概念和概念的节点深度之和,与1同概念概念节点深度之差绝对值之和的比值,本体概念的深度公式为:

6.根据权利要求1所述的一种基于语义相似度的工程装备试验案例知识检索方法,其特征在于,在领域本体语义相似度的公式中,本体概念语义距离相似度的权重和案例属性语义相似度的权重的获取方法为:

7.根据权利要求4所述的一种基于语义相似度的工程装备试验案例知识检索方法,其特征在于,在步骤二中,案例属性语义相似度计算中,将各个属性的权重乘以目标案例与历史案例相对应编号属性相似度的总和作为案例属性语义相似度,案例属性语义相似度的公式为:

8.根据权利要求7所述的一种基于语义相似度的工程装备试验案例知识检索方法,其特征在于,在案例属性语义相似度的公式中,目标案例和历史案例第j个属性的相似度为案例属性深度减去1的2倍,同目标案例和历史案例第j个属性在本体结构层次中最短路径欧式距离之差,再同案例属性深度减去1的2倍的比值,目标案例和历史案例第j个属性的相似度公式为:

9.根据权利要求8所述的一种基于语义相似度的工程装备试验案例知识检索方法,其特征在于,在目标案例和历史案例第j个属性的相似度公式中,综合考虑案例属性路径距离和节点深度,案例属性深度为目标案例第j个属性和历史案例第j个属性的节点深度之和,与1同目标案例第j个属性历史案例第j个属性之差绝对值之和的比值,案例属性深度公式为:

10.根据权利要求1所述的一种基于语义相似度的工程装备试验案例知识检索方法,其特征在于,在步骤四中,捕捉推送的工程装备试验案例文档中的关键词,基于关键词同义扩展进行二次知识检索,进行二次检索案例推送的流程包括:


技术总结
本发明涉及工程装备试验技术领域,具体公开了一种基于语义相似度的工程装备试验案例知识检索方法,包括构建工程装备试验案例本体、基于领域本体语义相似度进行知识检索分析计算、进行一次检索案例推送、捕捉推送的工程装备试验案例文档中的关键词,基于关键词同义扩展进行二次知识检索,进行二次检索案例推送;通过基于领域本体语义相似度进行知识检索分析计算,对工程装备试验设计领域显性及隐形经验知识进行规范化表示和检索重用,自动化实现工程装备试验案例知识检索,检索效率低且检索难度低,实现了军事与本体结合的工程装备试验案例知识检索。

技术研发人员:鞠进军,陈俞龙,张颖,汪辉,宋万马
受保护的技术使用者:中国人民解放军陆军工程大学
技术研发日:
技术公布日:2024/6/26
转载请注明原文地址:https://doc.8miu.com/read-1828651.html

最新回复(0)