面向知识图谱的电网文本数据模糊匹配方法

专利2025-11-07 19

本发明涉及的是一种电网控制领域的技术，具体是一种面向知识图谱的电网文本数据模糊匹配方法。

背景技术：

1、电网发生故障后的处理主要依赖于工作人员的主观决策。故障发生时，工作人员需要查询各类故障预案、调度规程、配网缺陷库等文本数据，这种故障处置方式时间成本高、执行效率低且准确性无法保证。因此需要利用算法对复杂的文本数据进行文本匹配。在电网文本数据进行匹配的过程中，大多是通过分解数据内容，来实现字符间的一一对应。但是，当出现有多余字符的情况时，这种方法就无法对数据进行有效处理。现有的电网文本数据匹配技术忽略匹配结果对工作人员的辅助性，直接将其以文本数据的形式展现出来。这不仅会增加工作人员的工作量，还有可能致使工作人员误判。因此，如果能将结果以逻辑图形的形式展示出来，可以有效减少误判的情况，提高工作效率。

技术实现思路

1、本发明针对现有技术存在的上述不足，提出一种面向知识图谱的电网文本数据模糊匹配方法，通过构建字典和关系列ids，并将匹配结果以知识图谱可视化的形式展现给相关工作人员，能够显著提高电网文本数据模糊匹配的准确性，并有效辅助工作人员进行文本数据分析。

2、本发明是通过以下技术方案实现的：

3、本发明涉及一种面向知识图谱的电网文本数据模糊匹配方法，将待处理数据分为匹配表和数据库后，将匹配表以字典的形式存储在数组中，并按逐行搜索的方式将字典中的数据在数据库中进行检索，将检索到的匹配数据与匹配表合并得到最终匹配数据；再将匹配数据按照归属的关系构建实体-关系-实体的形式，并将重复的实体合并；最后以知识图谱可视化的形式展现过滤结果。

技术特征：

1.一种面向知识图谱的电网文本数据模糊匹配方法，其特征在于，一种面向知识图谱的电网文本数据模糊匹配方法，将待处理数据分为匹配表和数据库后，将匹配表以字典的形式存储在数组中，并按逐行搜索的方式将字典中的数据在数据库中进行检索，将检索到的匹配数据与匹配表合并得到最终匹配数据；再将匹配数据按照归属的关系构建实体-关系-实体的形式，并将重复的实体合并；最后以知识图谱可视化的形式展现过滤结果。

2.根据权利要求1所述的面向知识图谱的电网文本数据模糊匹配方法，其特征是，所述的构建字典是指：定义变量‘关键字内容’，‘关键字字典’，以数组的形式存储在变量‘关键字内容’中，然后开始对‘关键字字典’内容中的defect_type_name列和keyid列按行依次搜索并将搜索到的内容存储在变量‘关键字字典’中后，将构建的字典以{关键字；关键字的值}的形式来表示。

3.根据权利要求1所述的面向知识图谱的电网文本数据模糊匹配方法，其特征是，所述的搜索，具体包括：在字典中构建新的一列keyids，将字典中的数据与数据库中被匹配列defectname按照每一行搜索的方式进行全部的字符匹配，当匹配成功并将检索的内容放入keyids中；否则继续向下一行进行重复查询。

4.根据权利要求1所述的面向知识图谱的电网文本数据模糊匹配方法，其特征是，所述的实体合并是指：将同一个实体对应的两个异常条目进行合并，然后删除掉合并前的节点，避免在知识图谱中构建重复节点和关系对工作人员产生误导。

5.根据权利要求1或4所述的面向知识图谱的电网文本数据模糊匹配方法，其特征是，所述的实体合并具体为：将实体‘site_name’和‘device_name’处多余的节点删除，将实体‘bureau_code’和‘defect_type_name’处的节点合并从而达到预期目标。

技术总结
一种面向知识图谱的电网文本数据模糊匹配方法，将待处理数据分为匹配表和数据库后，将匹配表以字典的形式存储在数组中，并按逐行搜索的方式将字典中的数据在数据库中进行检索，将检索到的匹配数据与匹配表合并得到最终匹配数据；再将匹配数据按照归属的关系构建实体‑关系‑实体的形式，并将重复的实体合并；最后以知识图谱可视化的形式展现过滤结果。本发明通过构建字典和关系列IDs，并将匹配结果以知识图谱可视化的形式展现给相关工作人员，能够显著提高电网文本数据模糊匹配的准确性，并有效辅助工作人员进行文本数据分析。

技术研发人员：余墨多,黄文焘,邰能灵,曹祝顺,陶佳欣
受保护的技术使用者：上海交通大学
技术研发日：
技术公布日：2024/6/26

转载请注明原文地址:https://doc.8miu.com/read-1824581.html

专利

最新回复(0)