本技术涉及数据处理,具体涉及内容搜索方法、装置、电子设备及计算机可读存储介质。
背景技术:
1、随着计算机技术和人工智能技术的发展,内容搜索的应用越来越广泛,用户对于内容搜索的要求也越来越高。
2、相关技术中,通常根据用户输入的搜索信息搜索获得与搜索信息相关的多媒体内容,并基于这些内容生成对搜索信息的回答。相关技术的问题在于,相关度高的内容并不一定含有用户搜索信息所对应的答案,从而可能导致并不能对用户搜索信息进行解答。
技术实现思路
1、本技术实施例提供一种内容搜索方法、装置、电子设备及计算机可读存储介质,在内容搜索过程中,确定候选内容与用户搜索信息之间的可用关系,从而对候选内容进行排序,基于排序和候选内容的内容分段确定与用户搜索信息匹配的目标内容,从而保证目标内容中能够包含用户搜索信息所对应的答案,进而有利于实现针对用户搜索信息的解答。
2、本技术实施例第一方面提供一种内容搜索方法,上述方法包括:
3、获取用户搜索信息,以及上述用户搜索信息对应的多个候选内容;
4、确定上述候选内容与上述用户搜索信息之间的可用关系;
5、至少基于上述可用关系,对上述候选内容进行排序;
6、基于上述候选内容的排序和上述候选内容的至少部分内容分段,从上述多个候选内容中确定与上述用户搜索信息相匹配的目标内容。
7、本技术实施例第二方面提供一种内容搜索方法,上述方法包括:
8、显示目标会话页面;
9、接收通过上述目标会话页面输入的用户搜索信息;
10、根据上述用户搜索信息,获取从上述用户搜索信息对应的多个候选内容中确定的与上述用户搜索信息相匹配的目标内容,其中,上述目标内容基于上述候选内容与上述用户搜索信息之间的可用关系确定;
11、在上述目标会话页面中显示至少部分目标内容。本技术实施例第三方面提供一种内容搜索装置,上述装置包括:
12、搜索信息获取模块,用于获取用户搜索信息,以及上述用户搜索信息对应的多个候选内容;
13、可用关系确定模块,用于确定上述候选内容与上述用户搜索信息之间的可用关系;
14、内容排序模块,用于至少基于上述可用关系,对上述候选内容进行排序;
15、目标内容确定模块,用于基于上述候选内容的排序和上述候选内容的至少部分内容分段,从上述多个候选内容中确定与上述用户搜索信息相匹配的目标内容。
16、在一些可选的实施例中,上述可用关系包括上述候选内容与上述用户搜索信息之间的可用关系类型以及上述候选内容在上述可用关系类型下的可用置信分。
17、在一些可选的实施例中,上述可用关系确定模块具体用于:
18、对上述用户搜索信息进行数据编码获得用户查询向量;
19、根据上述用户查询向量和上述候选内容,通过已训练的内容匹配模型确定上述候选内容与上述用户搜索信息之间的可用关系类型以及上述候选内容在上述可用关系类型下的可用置信分。
20、在一些可选的实施例中,上述内容搜索装置还具体用于:
21、基于上述用户查询向量的时效性类别和上述候选内容的发布时间,更新上述候选内容和/或更新上述候选内容对应的可用置信分。
22、在一些可选的实施例中,上述内容搜索装置还具体用于:
23、若上述用户查询向量的时效性类别为第一时效类别,基于上述候选内容的发布时间对上述候选内容进行筛选以更新上述候选内容;
24、若上述用户查询向量的时效性类别为第二时效类别,基于上述候选内容的发布时间降低上述候选内容对应的可用置信分;
25、若上述用户查询向量的时效性类别为第三时效类别,不更新上述候选内容和上述可用置信分。
26、在一些可选的实施例中,上述目标内容确定模块具体用于:
27、根据上述候选内容的排序确定从上述候选内容中确定第一候选内容和第二候选内容;
28、将上述第一候选内容作为目标内容,将上述第一候选内容的内容分段作为参考内容分段;
29、根据上述第二候选内容的排序依次选取上述第二候选内容并执行如下步骤,直至所有上述第二候选内容选取完毕或获得的目标内容的数目达到预设阈值:若上述第二候选内容的内容分段不与上述参考内容分段重复,则将上述第二候选内容作为目标内容,并将上述第二候选内容的内容分段作为参考内容分段。
30、在一些可选的实施例中,上述内容搜索装置还具体用于:
31、根据上述参考内容分段的文本内容计算获取上述参考内容分段对应的数据标识;
32、根据上述第二候选内容的内容分段的文本内容计算获取上述第二候选内容的内容分段对应的数据标识;
33、若上述第二候选内容的内容分段对应的数据标识与上述参考内容分段对应的数据标识相同,则上述第二内容的内容分段与上述参考内容分段重复。
34、在一些可选的实施例中,上述内容搜索装置还具体用于:
35、至少基于部分上述目标内容生成针对上述用户搜索信息的回答。
36、本技术实施例第四方面提供一种内容搜索装置,上述装置包括:
37、会话页面显示模块,用于显示目标会话页面;
38、用户搜索信息获取模块,用于接收通过上述目标会话页面输入的用户搜索信息;
39、目标内容获取模块,用于根据上述用户搜索信息,获取从上述用户搜索信息对应的多个候选内容中确定的与上述用户搜索信息相匹配的目标内容,其中,上述目标内容基于上述候选内容与上述用户搜索信息之间的可用关系确定;
40、目标内容显示模块,用于在上述目标会话页面中显示至少部分目标内容。
41、在一些可选的实施例中,上述目标内容显示模块具体用于:
42、获取至少基于部分上述目标内容生成的针对上述用户搜索信息的回答;
43、在上述目标会话页面中显示上述回答。
44、本技术实施例第五方面提供一种电子设备,包括存储器和处理器,上述存储器存储有应用程序,上述处理器用于运行上述存储器内的应用程序,以执行本技术实施例第一方面或第二方面提供的内容搜索方法中的步骤。
45、本技术实施例第六方面提供一种计算机可读存储介质,上述计算机可读存储介质存储有计算机程序,当上述计算机程序在电子设备上运行时,上述计算机程序用于使上述电子设备执行本技术实施例第一方面或第二方面提供的内容搜索方法中的步骤。
46、采用本技术实施例的方案,可以获取用户搜索信息,以及上述用户搜索信息对应的多个候选内容;确定上述候选内容与上述用户搜索信息之间的可用关系;至少基于上述可用关系,对上述候选内容进行排序;基于上述候选内容的排序和上述候选内容的至少部分内容分段,从上述多个候选内容中确定与上述用户搜索信息相匹配的目标内容。
47、如此,在内容搜索过程中,确定候选内容与用户搜索信息之间的可用关系,从而对候选内容进行排序,基于排序和候选内容的内容分段确定与用户搜索信息匹配的目标内容,从而保证目标内容中能够包含用户搜索信息所对应的答案,进而有利于实现针对用户搜索信息的解答,且有利于提升用户使用体验。
1.一种内容搜索方法,其特征在于,包括:
2.根据权利要求1所述的内容搜索方法,其特征在于,所述可用关系包括所述候选内容与所述用户搜索信息之间的可用关系类型以及所述候选内容在所述可用关系类型下的可用置信分。
3.根据权利要求2所述的内容搜索方法,其特征在于,所述确定所述候选内容与所述用户搜索信息之间的可用关系,包括:
4.根据权利要求3所述的内容搜索方法,其特征在于,在所述至少基于所述可用关系,对所述候选内容进行排序之前,所述方法还包括:
5.根据权利要求4所述的内容搜索方法,其特征在于,所述基于所述用户查询向量的时效性类别和所述候选内容的发布时间,更新所述候选内容和/或更新所述候选内容对应的可用置信分,包括:
6.根据权利要求1所述的内容搜索方法,其特征在于,所述基于所述候选内容的排序和所述候选内容的至少部分内容分段,从所述多个候选内容中确定与所述用户搜索信息相匹配的目标内容,包括:
7.根据权利要求6所述的内容搜索方法,其特征在于,所述方法还包括:
8.根据权利要求1至7任一项所述的内容搜索方法,其特征在于,所述方法还包括:
9.一种内容搜索方法,其特征在于,所述方法包括:
10.根据权利要求9所述的内容搜索方法,其特征在于,所述在所述目标会话页面中显示至少部分目标内容,包括:
11.一种内容搜索装置,其特征在于,所述装置包括:
12.一种内容搜索装置,其特征在于,所述装置包括:
13.一种电子设备,其特征在于,包括处理器和存储器,所述存储器存储有应用程序,所述处理器用于运行所述存储器内的应用程序,以执行权利要求1至10任一项所述的内容搜索方法的步骤。
14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,当所述计算机程序在电子设备上运行时,所述计算机程序用于使所述电子设备执行权利要求1至10任一项所述的内容搜索方法的步骤。