物品搜索的模型训练方法、搜索方法、装置、设备及介质与流程

专利2026-03-03 43

本发明涉及人工智能，具体涉及一种物品搜索的模型训练方法、物品搜索方法、装置、电子设备及计算机可读存储介质。

背景技术：

1、在现有的物品搜索方式中，在计算物品与用户输入的搜索词之间的相关性时，普遍是通过物品搜索模型计算两者的余弦相似度进行物品搜索，但是此种物品搜索方式容易损失搜索词或者物品中的细节，比如，丢失搜索词中的形容词以及丢失物品型号等参数，导致相关性计算不够准确，影响物品搜索准确度。

2、另外，为了提升业务效率，一般是将实际应用的物品搜索模型进行压缩得到编码器数量更少的小体量物品搜索模型，使得小体量物品搜索模型拥有更高的推理速度，但是该模型的学习能力以及性能都会明显降低，也会严重物品搜索准确度。

技术实现思路

1、本发明的实施例提供了一种物品搜索的模型训练方法、物品搜索方法、装置、电子设备及计算机可读存储介质，旨在提高物品相关性模型的物品搜索精度和物品搜索效率。

2、第一方面，本申请的实施例提供了一种物品搜索的模型训练方法，包括：

3、基于用户行为获取第一训练集，第一训练集包括至少两个第一候选对和第一相关性，所述第一候选对包括基于所述用户行为确定的搜索词和搜索物品，所述第一相关性表征所述搜索词与所述搜索物品之间的相关度，所述第一相关性基于所述用户行为得到；

4、获取第二训练集，所述第二训练集包括至少两个第二候选对和第二相关性，所述第二候选对包括搜索词和搜索物品，所述第二相关性表征所述搜索词与所述搜索物品之间的相关度；

5、根据所述第一训练集对初始的第一相关性模型进行训练，获得第一相关性模型，所述第一相关性模型用于确定搜索词与搜索物品之间的相关性；

6、根据所述第一相关性模型对初始的第二相关性模型进行训练，获得第二相关性模型，所述第二相关性模型用于确定搜索词与搜索物品之间的相关性，所述第二相关性模型的结构与所述第一相关性模型相同或者相似，所述第二相关性模型的参数少于所述第一相关性模型；

7、根据所述第二训练集和所述第一相关性模型，对所述第二相关性模型进行训练，获得目标相关性模型。

8、第二方面，本申请的实施例提供了一种物品搜索方法，包括：

9、获取目标搜索词；

10、获取与目标搜索词相匹配的多个候选物品；

11、将所述目标搜索词和所述候选物品输入目标相关性模型，获得所述目标搜索词和所述候选物品之间的相关性，其中，所述目标相关性模型利用上述的模型训练方法训练得到；

12、根据所述相关性，从所述多个候选物品中确定目标物品。

13、第三方面，本申请的实施例提供了一种物品搜索的模型训练装置，包括：

14、第一获取模块，用于基于用户行为获取第一训练集，第一训练集包括至少两个第一候选对和第一相关性，所述第一候选对包括基于所述用户行为确定的搜索词和搜索物品，所述第一相关性表征所述搜索词与所述搜索物品之间的相关度，所述第一相关性基于所述用户行为得到；

15、第二获取模块，用于获取第二训练集，所述第二训练集包括至少两个第二候选对和第二相关性，所述第二候选对包括搜索词和搜索物品，所述第二相关性表征所述搜索词与所述搜索物品之间的相关度；第一训练模块，用于根据所述第一训练集对初始的第一相关性模型进行训练，获得第一相关性模型，所述第一相关性模型用于确定搜索词与搜索物品之间的相关性；

16、第二训练模块，用于根据所述第一相关性模型对初始的第二相关性模型进行训练，获得第二相关性模型，所述第二相关性模型用于确定搜索词与搜索物品之间的相关性，所述第二相关性模型的结构与所述第一相关性模型相同或者相似，所述第二相关性模型的参数少于所述第一相关性模型；

17、第三训练模块，用于根据所述第二训练集和所述第一相关性模型，对所述第二相关性模型进行训练，获得目标相关性模型。

18、第四方面，本申请的实施例提供了一种物品搜索装置，包括：

19、第三获取模块，用于获取目标搜索词；

20、第四获取模块，用于获取与目标搜索词相匹配的多个候选物品；

21、输入模块，用于将所述目标搜索词和所述候选物品输入目标相关性模型，获得所述目标搜索词和所述候选物品之间的相关性，其中，所述目标相关性模型利用上述的模型训练方法训练得到；

22、确定模块，用于根据所述相关性，对所述候选物品进行排序后确定目标物品。

23、第五方面，本申请的实施例提供了一种电子设备，包括处理器和存储器，所述存储器存储有多条指令；所述处理器从所述存储器中加载指令，以执行本申请物品搜索的模型训练方法以及物品搜索方法中的步骤。

24、第六方面，本申请实施例还提供一种计算机可读存储介质，计算机可读存储介质存储有多条指令，指令适于处理器进行加载，以执行本申请物品搜索的模型训练方法以及物品搜索方法中的步骤。

25、本申请的实施例的有益效果：

26、相比于现有技术中的物品相关性搜索模型训练方式，在本申请实施例中，可以同时根据训练集中基于用户行为的训练数据和其他训练数据进行模型训练，充分利用了训练数据量大的特点以及数据精度高的特点，实现了相关性模型的精准训练，提升了物品搜索准确度。另外，在本实施例中，首先是对初始的第一相关性模型进行训练得到第一相关性模型，再利用第一相关性模型对初始的第二相关性模型进行训练得到第二相关性模型，再对第二相关性模型进一步训练得到目标相关性模型，保证相关性模型的模型体量更小的同时，还有效提升了物品搜索效率和物品搜索准确度。

技术特征：

1.一种模型训练方法，其特征在于，所述模型训练方法，包括：

2.根据权利要求1所述的模型训练方法，其特征在于，所述根据所述第一训练集对初始的第一相关性模型进行训练，获得第一相关性模型，包括：

3.根据权利要求2所述的模型训练方法，其特征在于，所述直至所述第一预测相关性与所述第一相关性满足第一收敛条件，获得第一相关性模型之后，还包括：

4.根据权利要求3所述的模型训练方法，其特征在于，所述第一收敛条件根据所述第一预测相关性和所述第一相关性确定，所述第二收敛条件根据所述第二预测相关性和所述第二相关性确定。

5.根据权利要求3所述的模型训练方法，其特征在于，所述根据所述第一相关性模型对初始的第二相关性模型进行训练，获得第二相关性模型，包括：

6.根据权利要求5所述的模型训练方法，其特征在于，所述根据所述第二训练集和所述第一相关性模型，对所述第二相关性模型进行训练，获得目标相关性模型，包括：

7.一种物品搜索方法，其特征在于，所述物品搜索方法，包括：

8.根据权利要求7所述的物品搜索方法，其特征在于，所述获取目标搜索词，包括：

9.一种物品搜索的模型训练装置，其特征在于，包括：

10.一种物品搜索装置，其特征在于，包括：

11.一种电子设备，其特征在于，包括处理器和存储器，所述存储器存储有多条指令；所述处理器从所述存储器中加载指令，以执行如权利要求1-6任一项所述的物品搜索的模型训练方法以及如权利要求7-8任一项所述的物品搜索方法。

12.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有多条指令，所述指令适于处理器进行加载，以执行如权利要求1～6任一项所述的物品搜索的模型训练方法以及如权利要求7-8任一项所述的物品搜索方法。

技术总结
本申请提供一种物品搜索的模型训练方法、物品搜索方法、装置、电子设备和存储介质，通过基于用户行为获取第一训练集，第一训练集包括至少两个第一候选对和第一相关性；获取第二训练集，所述第二训练集包括至少两个第二候选对和第二相关性；根据所述第一训练集对初始的第一相关性模型进行训练，获得第一相关性模型，所述第一相关性模型用于确定搜索词与搜索物品之间的相关性；根据所述第一相关性模型对初始的第二相关性模型进行训练，获得第二相关性模型；根据所述第二训练集和所述第一相关性模型，对所述第二相关性模型进行训练，获得目标相关性模型。本申请能够提高相关性模型的物品搜索精度和物品搜索效率。

技术研发人员：马子逸,陈畅,潘博远
受保护的技术使用者：小红书科技有限公司
技术研发日：
技术公布日：2024/6/26

转载请注明原文地址:https://doc.8miu.com/read-1828422.html

专利

最新回复(0)