本发明涉及的是一种电网控制领域的技术,具体是一种面向知识图谱的电网文本数据模糊匹配方法。
背景技术:
1、电网发生故障后的处理主要依赖于工作人员的主观决策。故障发生时,工作人员需要查询各类故障预案、调度规程、配网缺陷库等文本数据,这种故障处置方式时间成本高、执行效率低且准确性无法保证。因此需要利用算法对复杂的文本数据进行文本匹配。在电网文本数据进行匹配的过程中,大多是通过分解数据内容,来实现字符间的一一对应。但是,当出现有多余字符的情况时,这种方法就无法对数据进行有效处理。现有的电网文本数据匹配技术忽略匹配结果对工作人员的辅助性,直接将其以文本数据的形式展现出来。这不仅会增加工作人员的工作量,还有可能致使工作人员误判。因此,如果能将结果以逻辑图形的形式展示出来,可以有效减少误判的情况,提高工作效率。
技术实现思路
1、本发明针对现有技术存在的上述不足,提出一种面向知识图谱的电网文本数据模糊匹配方法,通过构建字典和关系列ids,并将匹配结果以知识图谱可视化的形式展现给相关工作人员,能够显著提高电网文本数据模糊匹配的准确性,并有效辅助工作人员进行文本数据分析。
2、本发明是通过以下技术方案实现的:
3、本发明涉及一种面向知识图谱的电网文本数据模糊匹配方法,将待处理数据分为匹配表和数据库后,将匹配表以字典的形式存储在数组中,并按逐行搜索的方式将字典中的数据在数据库中进行检索,将检索到的匹配数据与匹配表合并得到最终匹配数据;再将匹配数据按照归属的关系构建实体-关系-实体的形式,并将重复的实体合并;最后以知识图谱可视化的形式展现过滤结果。
1.一种面向知识图谱的电网文本数据模糊匹配方法,其特征在于,一种面向知识图谱的电网文本数据模糊匹配方法,将待处理数据分为匹配表和数据库后,将匹配表以字典的形式存储在数组中,并按逐行搜索的方式将字典中的数据在数据库中进行检索,将检索到的匹配数据与匹配表合并得到最终匹配数据;再将匹配数据按照归属的关系构建实体-关系-实体的形式,并将重复的实体合并;最后以知识图谱可视化的形式展现过滤结果。
2.根据权利要求1所述的面向知识图谱的电网文本数据模糊匹配方法,其特征是,所述的构建字典是指:定义变量‘关键字内容’,‘关键字字典’,以数组的形式存储在变量‘关键字内容’中,然后开始对‘关键字字典’内容中的defect_type_name列和keyid列按行依次搜索并将搜索到的内容存储在变量‘关键字字典’中后,将构建的字典以{关键字;关键字的值}的形式来表示。
3.根据权利要求1所述的面向知识图谱的电网文本数据模糊匹配方法,其特征是,所述的搜索,具体包括:在字典中构建新的一列keyids,将字典中的数据与数据库中被匹配列defectname按照每一行搜索的方式进行全部的字符匹配,当匹配成功并将检索的内容放入keyids中;否则继续向下一行进行重复查询。
4.根据权利要求1所述的面向知识图谱的电网文本数据模糊匹配方法,其特征是,所述的实体合并是指:将同一个实体对应的两个异常条目进行合并,然后删除掉合并前的节点,避免在知识图谱中构建重复节点和关系对工作人员产生误导。
5.根据权利要求1或4所述的面向知识图谱的电网文本数据模糊匹配方法,其特征是,所述的实体合并具体为:将实体‘site_name’和‘device_name’处多余的节点删除,将实体‘bureau_code’和‘defect_type_name’处的节点合并从而达到预期目标。
