本技术涉及文本处理,具体涉及一种企业知识图谱构建方法、装置、计算机设备及存储介质。
背景技术:
1、目前行业内构建的企业知识图谱,局限在基于网络信息或者收集企业内部数据库等渠道收集信息,集中于对企业的静态画像进行描述,保存有海量的企业信息数据以供用户进行浏览,但是对企业之间的商业往来行为关注不够。
技术实现思路
1、基于此,有必要针对上述技术问题,提供一种企业知识图谱构建方法、装置、计算机设备及存储介质,基于快件的收寄企业确定各企业之间的企业往来关系,然后结合于企业往来关系构建企业知识图谱,可以极大丰富企业知识图谱的关系维度,也可以极大扩展知识图谱的商业价值。
2、第一方面,本技术提供一种企业知识图谱构建方法,包括:
3、获取若干快件的运单字段信息;
4、解析若干所述运单字段信息,确定所述若干快件的收寄企业和所述收寄企业的企业往来关系;
5、获取所述收寄企业的企业信息;
6、根据所述收寄企业、所述企业往来关系以及所述企业信息,构建企业知识图谱。
7、在本技术一些实施例中,所述运单字段信息包括收寄地址字段和收寄件人字段,所述解析若干所述运单字段信息,确定所述若干快件的收寄企业和所述收寄企业的企业往来关系,包括:
8、将所述收寄件人字段与预设的企业信息数仓中的企业名称进行匹配,得到至少一个候选企业和所述候选企业的企业注册地址;
9、解析所述收寄地址字段确定收寄企业地址;
10、根据所述候选企业、所述企业注册地址和所述收寄企业地址,确定所述收寄企业;
11、根据属于同一运单的收寄企业确定所述企业往来关系。
12、在本技术一些实施例中,所述解析所述收寄地址字段确定收寄企业地址,包括:
13、根据预设的前缀行政地词典匹配所述收寄地址字段,得到至少一个地址分词;
14、根据预设的后缀行政单位词典对各所述地址分词进行匹配,得到各地址行政层级的地址信息,所述后缀行政单位词典包括预设层级的地址行政层级的行政单位名称;
15、根据各所述地址行政层级的地址信息,确定所述收寄企业地址和所述收寄企业地址的收寄地址实体列表。
16、在本技术一些实施例中,所述根据预设的后缀行政单位词典对各所述地址分词进行匹配,得到各地址行政层级的地址信息,包括:
17、根据预设的后缀行政单位词典识别各所述地址分词的行政单位名称;
18、根据各所述地址分词的行政单位名称,得到所述收寄地址字段各地址行政层级的地址信息;其中,若某收寄地址字段的各地址分词的行政单位名称不包含目标地址行政层级的行政单位名称,则确定所述某收寄地址字段的所述目标地址行政层级的地址信息为预设符号;
19、若预设地址行政层级的地址信息为预设符号,则根据预设的行政地址数据库对所述预设地址行政层级的地址信息进行补全。
20、在本技术一些实施例中,所述根据所述候选企业、所述企业注册地址和所述收寄企业地址,确定所述收寄企业,包括:
21、获取所述企业注册地址的候选地址实体列表;
22、根据所述收寄地址实体列表和所述候选地址实体列表,确定所述企业注册地址中与所述收寄企业地址匹配的目标企业注册地址;
23、根据所述目标企业注册地址和所述候选企业确定所述收寄企业
24、在本技术一些实施例中,所述根据所述收寄地址实体列表和所述候选地址实体列表,确定所述企业注册地址中与所述收寄企业地址匹配的目标企业注册地址,包括:
25、将所述收寄地址实体列表和所述候选地址实体列表中各地址行政层级的地址信息进行匹配,得到各所述企业注册地址的地址匹配度;
26、若某企业注册地址的地址匹配度大于等于预设匹配度,则确定所述某企业注册地址为目标企业注册地址;和/或,
27、根据所述收寄地址实体列表确定所述收寄企业地址所属的第一兴趣点;
28、根据所述候选地址实体列表确定各所述企业注册地址所属的第二兴趣点;
29、若某企业注册地址的第二兴趣点与所述第一兴趣点为同一兴趣点,则确定所述某企业注册地址为目标企业注册地址;和/或,
30、根据所述收寄地址实体列表确定所述收寄企业地址的第一经纬度;
31、根据所述候选地址实体列表确定各所述企业注册地址的第二经纬度;
32、若某企业注册地址的第二经纬度与所述第一经纬度的距离差值小于等于预设距离,则确定所述某企业注册地址为目标企业注册地址。
33、在本技术一些实施例中,所述运单字段信息还包括快件属性字段,所述根据所述收寄企业、所述企业往来关系以及所述企业信息,构建企业知识图谱之前,还包括:
34、解析所述快件属性字段确定收寄企业和所述快件的快件属性信息;
35、所述根据所述收寄企业、所述企业往来关系以及所述企业信息,构建企业知识图谱,包括:
36、根据所述收寄企业、所述企业往来关系、所述企业信息以及所述快件属性信息,构建企业知识图谱。
37、第二方面,本技术提供一种企业知识图谱构建装置,包括:
38、运单获取模块,用于获取若干快件的运单字段信息;
39、运单分析模块,与所述运单获取模块通讯连接,用于解析若干所述运单字段信息,确定所述若干快件的收寄企业和所述收寄企业的企业往来关系;
40、数据获取模块,与所述运单分析模块通讯连接,用于获取所述收寄企业的企业信息;
41、图谱构建模块,与所述运单分析模块、所述数据获取模块通讯连接,用于根据所述收寄企业、所述企业往来关系以及所述企业信息,构建企业知识图谱。
42、在本技术一些实施例中,所述运单字段信息包括收寄地址字段和收寄件人字段,运单分析模块还用于将所述收寄件人字段与预设的企业信息数仓中的企业名称进行匹配,得到至少一个候选企业和所述候选企业的企业注册地址;解析所述收寄地址字段确定收寄企业地址;根据所述候选企业、所述企业注册地址和所述收寄企业地址,确定所述收寄企业;根据属于同一运单的收寄企业确定所述企业往来关系。
43、在本技术一些实施例中,运单分析模块还用于根据预设的前缀行政地词典匹配所述收寄地址字段,得到至少一个地址分词;根据预设的后缀行政单位词典对各所述地址分词进行匹配,得到各地址行政层级的地址信息,所述后缀行政单位词典包括预设层级的地址行政层级的行政单位名称;根据各所述地址行政层级的地址信息,确定所述收寄企业地址和所述收寄企业地址的收寄地址实体列表。
44、在本技术一些实施例中,运单分析模块还用于根据预设的后缀行政单位词典识别各所述地址分词的行政单位名称;根据各所述地址分词的行政单位名称,得到所述收寄地址字段各地址行政层级的地址信息;其中,若某收寄地址字段的各地址分词的行政单位名称不包含目标地址行政层级的行政单位名称,则确定所述某收寄地址字段的所述目标地址行政层级的地址信息为预设符号;若预设地址行政层级的地址信息为预设符号,则根据预设的行政地址数据库对所述预设地址行政层级的地址信息进行补全。
45、在本技术一些实施例中,运单分析模块还用于获取所述企业注册地址的候选地址实体列表;根据所述收寄地址实体列表和所述候选地址实体列表,确定所述企业注册地址中与所述收寄企业地址匹配的目标企业注册地址;根据所述目标企业注册地址和所述候选企业确定所述收寄企业。
46、在本技术一些实施例中,运单分析模块还用于将所述收寄地址实体列表和所述候选地址实体列表中各地址行政层级的地址信息进行匹配,得到各所述企业注册地址的地址匹配度;若某企业注册地址的地址匹配度大于等于预设匹配度,则确定所述某企业注册地址为目标企业注册地址;和/或,根据所述收寄地址实体列表确定所述收寄企业地址所属的第一兴趣点;根据所述候选地址实体列表确定各所述企业注册地址所属的第二兴趣点;若某企业注册地址的第二兴趣点与所述第一兴趣点为同一兴趣点,则确定所述某企业注册地址为目标企业注册地址;和/或,根据所述收寄地址实体列表确定所述收寄企业地址的第一经纬度;根据所述候选地址实体列表确定各所述企业注册地址的第二经纬度;若某企业注册地址的第二经纬度与所述第一经纬度的距离差值小于等于预设距离,则确定所述某企业注册地址为目标企业注册地址。
47、在本技术一些实施例中,所述运单字段信息还包括快件属性字段,图谱构建模块还用于解析所述快件属性字段确定收寄企业和所述快件的快件属性信息;根据所述收寄企业、所述企业往来关系、所述企业信息以及所述快件属性信息,构建企业知识图谱。
48、第三方面,本技术还提供一种计算机设备,所述计算机设备包括:
49、一个或多个处理器;
50、存储器;以及一个或多个应用程序,其中所述一个或多个应用程序被存储于所述存储器中,并配置为由所述处理器执行以实现所述的企业知识图谱构建方法。
51、第四方面,本技术还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器进行加载,以执行的企业知识图谱构建方法中的步骤。
52、上述企业知识图谱构建方法、装置、计算机设备及存储介质,基于快件的运单字段信息解析各收寄企业以及各收件企业之间的企业往来关系,然后结合于企业往来关系、企业信息构建企业知识图谱,企业知识图谱不仅包含各企业的静态属性信息,还包含相互之间的动态商业往来,极大丰富企业知识图谱的关系维度,也可以极大扩展知识图谱的商业价值。
1.一种企业知识图谱构建方法,其特征在于,包括:
2.如权利要求1所述的企业知识图谱构建方法,其特征在于,所述运单字段信息包括收寄地址字段和收寄件人字段,所述解析若干所述运单字段信息,确定所述若干快件的收寄企业和所述收寄企业的企业往来关系,包括:
3.如权利要求2所述的企业知识图谱构建方法,其特征在于,所述解析所述收寄地址字段确定收寄企业地址,包括:
4.如权利要求3所述的企业知识图谱构建方法,其特征在于,所述根据预设的后缀行政单位词典对各所述地址分词进行匹配,得到各地址行政层级的地址信息,包括:
5.如权利要求3所述的企业知识图谱构建方法,其特征在于,所述根据所述候选企业、所述企业注册地址和所述收寄企业地址,确定所述收寄企业,包括:
6.如权利要求5所述的企业知识图谱构建方法,其特征在于,所述根据所述收寄地址实体列表和所述候选地址实体列表,确定所述企业注册地址中与所述收寄企业地址匹配的目标企业注册地址,包括:
7.如权利要求2所述的企业知识图谱构建方法,其特征在于,所述运单字段信息还包括快件属性字段,所述根据所述收寄企业、所述企业往来关系以及所述企业信息,构建企业知识图谱之前,还包括:
8.一种企业知识图谱构建装置,其特征在于,包括:
9.一种计算机设备,其特征在于,所述计算机设备包括:
10.一种计算机存储介质,其特征在于,其上存储有计算机程序,所述计算机程序被处理器进行加载,以执行权利要求1至7任一项所述的企业知识图谱构建方法中的步骤。
