词语推荐方法和装置、存储介质及电子设备与流程

专利2026-01-20  12


本技术涉及计算机,具体而言,涉及一种词语推荐方法和装置、存储介质及电子设备。


背景技术:

1、在各内容交互平台中,通常采用输入法应用输入文字的方式进行用户间的互动,在文字输入过程中,输入法的选词策略主要是通过计算出全体用户在历史周期内使用的高频词、热点词等,在确定预先设置的个性词词库中存在计算出的高频词或热点词的情况下,将个性词词库推送给用户。

2、采用上述方法,仅能根据当前的交互场景触发词进行个性词词库的推荐,与用户的相关性较弱,并且个性词词库中的词语是基于词汇本身进行构造,缺乏用户深度信息特征及精细化表达,例如,用户的id特征、家庭、兴趣爱好等特征,使得无法实现根据用户兴趣爱好、专业领域等信息向用户推荐目标词语。

3、为了解决上述问题,相关技术中采用启发式规则的个性词排序策略,其主旨在于通过对多路召回的多种个性词在各路召回源中的得分进行融合排序,根据排序结果,确定目标推荐词语。但需要留意的是,采用该启发式规则的个性词排序策略,仅依赖于多种个性词在各路召回列表中的得分,而忽略了个性词或个性词向量本身的特征信息,使得词语排序结果的可靠性较低,从而造成了词语推荐过程中出现的准确率较低的技术问题。

4、针对上述的问题,目前尚未提出有效的解决方案。


技术实现思路

1、本技术实施例提供了一种词语推荐方法和装置、存储介质及电子设备,以至少解决在词语推荐过程中出现的准确率较低的技术问题。

2、根据本技术实施例的一个方面,提供了一种词语推荐方法,包括:获取待推荐给目标帐号的个性词集合,其中,个性词集合包括n个个性词,n为大于或等于2的正整数;根据m个向量识别模型,确定m个个性词向量集合和m个帐号向量,其中,m个个性词向量集合中的各个个性词向量集合包括n个个性词中的各个个性词的词向量,m个帐号向量中的各个帐号向量是目标帐号的帐号向量,m为大于或等于2的正整数,m个向量识别模型是不同的向量识别模型;获取目标特征向量集合,其中,目标特征向量集合包括个性词集合中的各个个性词在k1个维度上的特征,和/或,目标帐号在k2个维度上的特征;k1等于1或为大于或等于2的正整数,k2等于1或为大于或等于2的正整数;根据m个个性词向量集合、m个帐号向量以及目标特征向量集合,在个性词集合中确定向目标帐号推荐的目标词语。

3、可选地,上述根据m个个性词向量集合、m个帐号向量以及目标特征向量集合,在个性词集合中确定向目标帐号推荐的目标词语,包括:根据m个个性词向量集合,确定与个性词集合对应的个性词加权向量集合,其中,个性词加权向量集合包括n个个性词加权向量,n个个性词加权向量中的各个个性词加权向量是n个个性词中对应的个性词的加权词向量;根据m个帐号向量,确定目标帐号的加权帐号向量;根据个性词加权向量集合、加权帐号向量以及目标特征向量集合,在个性词集合中确定向目标帐号推荐的目标词语。

4、可选地,上述根据m个个性词向量集合,确定与个性词集合对应的个性词加权向量集合,包括:通过以下步骤获取个性词集合中的第i个个性词的个性词加权向量,其中,i为大于或等于1、且小于或等于n的正整数:在m个个性词向量集合中的各个个性词向量集合中获取第i个个性词的个性词向量,得到第i个个性词的m个个性词向量;对m个个性词向量执行平均操作,得到第i个个性词的个性词加权向量;或者,对m个个性词向量执行加权求和操作,得到第i个个性词的个性词加权向量。

5、可选地,上述根据个性词加权向量集合、加权帐号向量以及目标特征向量集合,在个性词集合中确定向目标帐号推荐的目标词语,包括:根据个性词加权向量集合、加权帐号向量以及目标特征向量集合,确定个性词集合中的各个个性词的目标推荐参数的取值;将个性词集合中目标推荐参数的取值从大到小排在前p位的个性词确定为向目标帐号推荐的目标词语,其中,p等于1或为大于或等于2的正整数。

6、可选地,上述根据个性词加权向量集合、加权帐号向量以及目标特征向量集合,确定个性词集合中的各个个性词的目标推荐参数的取值,包括:通过以下步骤获取个性词集合中的第i个个性词的目标推荐参数的取值,其中,i为大于或等于1、且小于或等于n的正整数:在个性词加权向量集合中获取第i个个性词的个性词加权向量;在目标特征向量集合包括个性词集合中的各个个性词在k1个维度上的特征的情况下,在目标特征向量集合中获取第i个个性词在k1个维度上的特征,得到第i个个性词对应的第i组个性词特征;根据第i个个性词的个性词加权向量、加权帐号向量以及第i组个性词特征,确定第i个个性词的融合表征向量;根据第i个个性词的融合表征向量,确定第i个个性词的目标推荐参数的取值。

7、可选地,上述根据第i个个性词的个性词加权向量、加权帐号向量以及第i组个性词特征,确定第i个个性词的融合表征向量,包括以下之一:在第i组个性词特征包括数字类型的第一组个性词特征的情况下,将第i个个性词的个性词加权向量、加权帐号向量以及第一组个性词特征进行拼接,得到第一拼接向量;将第一拼接向量输入到第一目标深度神经网络,得到第i个个性词的融合表征向量;在第i组个性词特征包括非数字类型的第二组个性词特征的情况下,将第二组个性词特征映射成数字类型的第三组个性词特征,将第三组个性词特征输入到第二目标深度神经网络,得到第i个个性词的第一表征向量;将第i个个性词的个性词加权向量、加权帐号向量以及第一表征向量进行拼接,得到第二拼接向量;将第二拼接向量输入到第一目标深度神经网络,得到第i个个性词的融合表征向量;在第i组个性词特征包括数字类型的第一组个性词特征和非数字类型的第二组个性词特征的情况下,将第二组个性词特征映射成数字类型的第三组个性词特征,将第三组个性词特征输入到第二目标深度神经网络,得到第i个个性词的第一表征向量;将第i个个性词的个性词加权向量、加权帐号向量、第一组个性词特征以及第一表征向量进行拼接,得到第三拼接向量;将第三拼接向量输入到第一目标深度神经网络,得到第i个个性词的融合表征向量。

8、可选地,上述根据个性词加权向量集合、加权帐号向量以及目标特征向量集合,确定个性词集合中的各个个性词的目标推荐参数的取值,包括:通过以下步骤获取个性词集合中的第i个个性词的目标推荐参数的取值,其中,i为大于或等于1、且小于或等于n的正整数:在个性词加权向量集合中获取第i个个性词的个性词加权向量;在目标特征向量集合包括目标帐号在k2个维度上的特征的情况下,在目标特征向量集合中获取目标帐号在k2个维度上的特征,得到一组目标帐号特征;根据第i个个性词的个性词加权向量、加权帐号向量以及一组目标帐号特征,确定第i个个性词的融合表征向量;根据第i个个性词的融合表征向量,确定第i个个性词的目标推荐参数的取值。

9、可选地,上述根据第i个个性词的个性词加权向量、加权帐号向量以及一组目标帐号特征,确定第i个个性词的融合表征向量,包括以下之一:在一组目标帐号特征包括数字类型的第一组帐号特征的情况下,将第i个个性词的个性词加权向量、加权帐号向量以及第一组帐号特征进行拼接,得到第四拼接向量;将第四拼接向量输入到第一目标深度神经网络,得到第i个个性词的融合表征向量;在一组目标帐号特征包括非数字类型的第二组帐号特征的情况下,将第二组帐号特征映射成数字类型的第三组帐号特征,将第三组帐号特征输入到第二目标深度神经网络,得到目标帐号的第二表征向量;将第i个个性词的个性词加权向量、加权帐号向量以及第二表征向量进行拼接,得到第五拼接向量;将第五拼接向量输入到第一目标深度神经网络,得到第i个个性词的融合表征向量;在一组目标帐号特征包括数字类型的第一组帐号特征和非数字类型的第二组帐号特征的情况下,将第二组帐号特征映射成数字类型的第三组帐号特征,将第三组帐号特征输入到第二目标深度神经网络,得到目标帐号的第二表征向量;将第i个个性词的个性词加权向量、加权帐号向量、第一组帐号特征以及第二表征向量进行拼接,得到第六拼接向量;将第六拼接向量输入到第一目标深度神经网络,得到第i个个性词的融合表征向量。

10、可选地,上述根据个性词加权向量集合、加权帐号向量以及目标特征向量集合,确定个性词集合中的各个个性词的目标推荐参数的取值,包括:通过以下步骤获取个性词集合中的第i个个性词的目标推荐参数的取值,其中,i为大于或等于1、且小于或等于n的正整数:在个性词加权向量集合中获取第i个个性词的个性词加权向量;在目标特征向量集合包括个性词集合中的各个个性词在k1个维度上的特征和目标帐号在k2个维度上的特征的情况下,在目标特征向量集合中获取第i个个性词在k1个维度上的特征,得到第i个个性词对应的第i组个性词特征,并在目标特征向量集合中获取目标帐号在k2个维度上的特征,得到一组目标帐号特征;根据第i个个性词的个性词加权向量、加权帐号向量、一组目标帐号特征、以及第i组个性词特征,确定第i个个性词的融合表征向量;根据第i个个性词的融合表征向量,确定第i个个性词的目标推荐参数的取值。

11、可选地,上述根据第i个个性词的融合表征向量,确定第i个个性词的目标推荐参数的取值,包括以下之一:将第i个个性词的融合表征向量输入到目标逻辑回归模型,得到第i个个性词的目标推荐参数的取值;或者将第i个个性词的融合表征向量以及目标交互特征输入到目标逻辑回归模型,得到第i个个性词的目标推荐参数的取值,其中,目标交互特征是第i个个性词与目标帐号之间的交互特征,目标交互特征是根据m个帐号向量和第i个个性词的个性词加权向量确定得到的特征,或者,是根据加权帐号向量和第i个个性词的个性词加权向量确定得到的特征。

12、可选地,上述方法还包括以下之一:将m个帐号向量中的各个帐号向量分别与第i个个性词的个性词加权向量进行内积操作,得到m个内积值,其中,目标交互特征包括m个内积值,m个帐号向量中的各个帐号向量中的特征的数量与第i个个性词的个性词加权向量中的特征的数量相同;将加权帐号向量与第i个个性词的个性词加权向量进行内积操作,得到目标内积值,其中,目标交互特征包括目标内积值,加权帐号向量中的特征的数量与第i个个性词的个性词加权向量中的特征的数量相同。

13、根据本技术实施例的又一方面,还提供了一种词语推荐装置,包括:第一获取单元,用于获取待推荐给目标帐号的个性词集合,其中,个性词集合包括n个个性词,n为大于或等于2的正整数;第一处理单元,用于根据m个向量识别模型,确定m个个性词向量集合和m个帐号向量,其中,m个个性词向量集合中的各个个性词向量集合包括n个个性词中的各个个性词的词向量,m个帐号向量中的各个帐号向量是目标帐号的帐号向量,m为大于或等于2的正整数,m个向量识别模型是不同的向量识别模型;第二获取单元,用于获取目标特征向量集合,其中,目标特征向量集合包括个性词集合中的各个个性词在k1个维度上的特征,和/或,目标帐号在k2个维度上的特征;k1等于1或为大于或等于2的正整数,k2等于1或为大于或等于2的正整数;第二处理单元,用于根据m个个性词向量集合、m个帐号向量以及目标特征向量集合,在个性词集合中确定向目标帐号推荐的目标词语。

14、根据本技术实施例的又一方面,还提供了一种计算机可读的存储介质,该计算机可读的存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述词语推荐方法。

15、根据本技术实施例的又一方面,还提供了一种计算机程序产品,包括计算机程序/指令,该计算机程序/指令被处理器执行时实现上述方法的步骤。

16、根据本技术实施例的又一方面,还提供了一种电子设备,包括存储器和处理器,上述存储器中存储有计算机程序,上述处理器被设置为通过计算机程序执行上述词语推荐方法。

17、通过本技术提供的上述实施例,通过获取目标特征向量集合中的各个个性词在k1个维度上的特征,和/或,目标帐号在k2个维度上的特征,引入了除个性词本身及目标帐号本身的特征信息之外的其他多个维度上的特征信息,能够对用户的深度信息特征进行表达,同时使用更多更细的信息粒度来表征个性词,从而使得利用m个个性词向量集合、m个帐号向量以及目标特征向量集合所确定的目标词语的更加准确,解决了词推荐过程中出现的准确率较低的技术问题,实现了提高词语推荐的准确性的技术效果。


技术特征:

1.一种词语推荐方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述根据所述m个个性词向量集合、所述m个帐号向量以及所述目标特征向量集合,在所述个性词集合中确定向所述目标帐号推荐的目标词语,包括:

3.根据权利要求2所述的方法,其特征在于,所述根据所述m个个性词向量集合,确定与所述个性词集合对应的个性词加权向量集合,包括:

4.根据权利要求2所述的方法,其特征在于,所述根据所述个性词加权向量集合、所述加权帐号向量以及所述目标特征向量集合,在所述个性词集合中确定向所述目标帐号推荐的目标词语,包括:

5.根据权利要求4所述的方法,其特征在于,所述根据所述个性词加权向量集合、所述加权帐号向量以及所述目标特征向量集合,确定所述个性词集合中的各个个性词的目标推荐参数的取值,包括:

6.根据权利要求5所述的方法,其特征在于,所述根据所述第i个个性词的个性词加权向量、所述加权帐号向量以及所述第i组个性词特征,确定所述第i个个性词的融合表征向量,包括以下之一:

7.根据权利要求4所述的方法,其特征在于,所述根据所述个性词加权向量集合、所述加权帐号向量以及所述目标特征向量集合,确定所述个性词集合中的各个个性词的目标推荐参数的取值,包括:

8.根据权利要求7所述的方法,其特征在于,所述根据所述第i个个性词的个性词加权向量、所述加权帐号向量以及所述一组目标帐号特征,确定所述第i个个性词的融合表征向量,包括以下之一:

9.根据权利要求4所述的方法,其特征在于,所述根据所述个性词加权向量集合、所述加权帐号向量以及所述目标特征向量集合,确定所述个性词集合中的各个个性词的目标推荐参数的取值,包括:

10.根据权利要求5至9中任一项所述的方法,其特征在于,所述根据所述第i个个性词的融合表征向量,确定所述第i个个性词的目标推荐参数的取值,包括以下之一:

11.根据权利要求10所述的方法,其特征在于,所述方法还包括以下之一:

12.一种词语推荐装置,其特征在于,包括:

13.一种计算机可读的存储介质,其特征在于,所述计算机可读的存储介质包括存储的程序,其中,所述程序可被终端设备或计算机运行时执行所述权利要求1至11任一项中所述的方法。

14.一种计算机程序产品,包括计算机程序/指令,其特征在于,该计算机程序/指令被处理器执行时实现权利要求1至11任一项中所述方法的步骤。

15.一种电子设备,包括存储器和处理器,其特征在于,所述存储器中存储有计算机程序,所述处理器被设置为通过所述计算机程序执行所述权利要求1至11任一项中所述的方法。


技术总结
本申请公开了一种词语推荐方法和装置、存储介质及电子设备。其中,该方法包括:获取待推荐给目标帐号的个性词集合;根据M个向量识别模型,确定M个个性词向量集合和M个帐号向量,其中,M个个性词向量集合中的各个个性词向量集合包括N个个性词中的各个个性词的词向量,M个帐号向量中的各个帐号向量是目标帐号的帐号向量;获取目标特征向量集合,其中,目标特征向量集合包括个性词集合中的各个个性词在K1个维度上的特征,和/或,目标帐号在K2个维度上的特征;根据M个个性词向量集合、M个帐号向量以及目标特征向量集合,在个性词集合中确定向目标帐号推荐的目标词语。本申请解决了在词语推荐过程中出现的准确率较低的技术问题。

技术研发人员:李鑫
受保护的技术使用者:腾讯科技(深圳)有限公司
技术研发日:
技术公布日:2024/6/26
转载请注明原文地址:https://doc.8miu.com/index.php/read-1826435.html

最新回复(0)