一种内容推荐模型训练方法，内容推荐方法及相关设备与流程

专利2025-05-29 47

本申请涉及数据处理领域，具体涉及一种内容推荐模型训练方法，内容推荐方法及相关设备。

背景技术：

1、随着互联网的普及，越来越多的信息以发布内容的形式被分享，这造成了严重的信息过载。根据用户偏好，通过推荐系统可以向用户推荐内容，缓解信息过载。现有的推荐系统通常是基于bert的推荐模型，将内容输入基于bert的推荐模型，以生成内容的嵌入表示，基于嵌入表示的相似度进行内容推荐，但由于忽略了内容中的有效信息，导致推荐效果较差。

技术实现思路

1、本申请实施例提供一种内容推荐模型训练方法，内容推荐方法及相关设备，可以通过任务提示集成至少两个任务，根据内容推荐模型生成目标内容的表征向量以及目标信息，增加信息增益，从而提高推荐内容的精确性。

2、第一方面，本申请实施例提供一种内容推荐模型训练方法，包括：

3、基于训练样本获取所述训练样本对应的任务提示，所述任务提示指示执行第一任务和至少一个第二任务，所述第一任务和所述第二任务的至少部分处理相似，所述任务提示还包括所述训练样本的至少部分组成内容；

4、将所述任务提示输入待训练的内容推荐模型，以便所述内容推荐模型针对所述训练样本执行所述第一任务和执行所述第二任务；

5、基于所述内容推荐模型执行第一任务和第二任务所得到的任务输出、第一任务损失和第二任务损失，对所述内容推荐模型进行训练，直到得到训练好的内容推荐模型。

6、第二方面，本申请实施例提供一种内容推荐方法，应用于服务端，包括：

7、获取目标内容；

8、基于所述目标内容，构建目标任务提示，所述目标任务提示至少指示执行第一任务，所述目标任务提示还包括所述目标内容的至少部分组成内容；

9、将所述目标任务提示输入内容推荐模型，以便所述内容推荐模型针对所述目标内容执行所述第一任务；

10、基于所述内容推荐模型执行第一任务得到的目标内容的表征向量，确定与所述目标内容匹配的候选内容。

11、第三方面，本申请实施例提供一种内容推荐方法，应用于客户端，包括：

12、向服务端发送内容推荐请求，触发所述服务端确定当前用户账户对应的目标内容，以及基于上述内容推荐模型训练方法训练得到的内容推荐模型确定与所述目标内容匹配的候选内容；

13、接收服务端基于所述候选内容中的至少部分内容返回的推荐内容，显示所述推荐内容。

14、第四方面，本申请实施例还提供一种内容推荐模型训练装置，包括：

15、任务提示获取模块，用于基于训练样本获取所述训练样本对应的任务提示，所述任务提示指示执行第一任务和至少一个第二任务，所述第一任务和所述第二任务的至少部分处理相似，所述任务提示还包括所述训练样本的至少部分组成内容；

16、执行模块，用于将所述任务提示输入待训练的内容推荐模型，以便所述内容推荐模型针对所述训练样本执行所述第一任务和执行所述第二任务；

17、内容推荐模型训练模块，用于基于所述内容推荐模型执行第一任务和第二任务所得到的任务输出、第一任务损失和第二任务损失，对所述内容推荐模型进行训练，直到得到训练好的内容推荐模型。

18、第五方面，本申请实施例还提供一种内容推荐装置，应用于服务端，包括：

19、目标内容获取模块，用于获取目标内容；

20、目标任务提示构建模块，用于基于所述目标内容，构建目标任务提示，所述目标任务提示至少指示执行第一任务，所述目标任务提示还包括所述目标内容的至少部分组成内容；

21、执行模块，用于将所述目标任务提示输入内容推荐模型，以便所述内容推荐模型针对所述目标内容执行所述第一任务；

22、候选内容确定模块，用于基于所述内容推荐模型执行第一任务得到的目标内容的表征向量，确定与所述目标内容匹配的候选内容。

23、第六方面，本申请实施例还提供一种内容推荐模型装置，应用于客户端，包括：

24、内容推荐请求发送模块，用于向服务端发送内容推荐请求，触发所述服务端确定当前用户账户对应的目标内容，以及基于上述内容推荐模型训练方法训练得到的内容推荐模型确定与所述目标内容匹配的候选内容；

25、显示模块，用于接收服务端基于所述候选内容中的至少部分内容返回的推荐内容，显示所述推荐内容。

26、第七方面，本申请实施例还提供一种电子设备，包括处理器和存储器，其中，所述存储器存储有计算机程序，当所述计算机程序被所述处理器执行时，使得所述处理器执行本申请实施例所提供的任一种所述内容推荐模型训练方法的步骤，或者，使得所述处理器执行本申请实施例所提供的任一种所述内容推荐方法的步骤。

27、第八方面，本申请实施例还提供一种计算机可读存储介质，包括计算机程序，当所述计算机程序在电子设备上运行时，所述计算机程序用于使所述电子设备执行本申请实施例所提供的任一种所述内容推荐模型训练方法的步骤，或者，所述计算机程序用于使所述电子设备执行本申请实施例所提供的任一种所述内容推荐方法的步骤。

28、第九方面，本申请实施例还提供一种计算机程序产品，包括计算机程序，所述计算机程序存储在计算机可读存储介质中；当电子设备的处理器从所述计算机可读存储介质读取所述计算机程序时，所述处理器执行所述计算机程序，使得所述电子设备执行本申请实施例所提供的任一种所述内容推荐模型训练方法的步骤，或者，使得所述电子设备执行本申请实施例所提供的任一种所述内容推荐方法的步骤。

29、采用本申请实施例的方案，可以通过基于训练样本获取所述训练样本对应的任务提示，所述任务提示指示执行第一任务和至少一个第二任务，所述第一任务和所述第二任务的至少部分处理相似，所述任务提示还包括所述训练样本的至少部分组成内容；将所述任务提示输入待训练的内容推荐模型，以便所述内容推荐模型针对所述训练样本执行所述第一任务和执行所述第二任务；基于所述内容推荐模型执行第一任务和第二任务所得到的任务输出、第一任务损失和第二任务损失，对所述内容推荐模型进行训练，直到得到训练好的内容推荐模型。通过任务提示集成至少两个任务，根据内容推荐模型生成目标内容的表征向量以及目标信息，增加信息增益，从而提高推荐内容的精确性。

技术特征：

1.一种内容推荐模型训练方法，其特征在于，包括：

2.根据权利要求1所述的内容推荐模型训练方法，其特征在于，所述第一任务是推荐任务，第一任务输出是基于所述训练样本得到的表征向量，基于所述表征向量，计算第一任务损失，所述第一任务损失是对比学习对应的损失函数。

3.根据权利要求1所述的内容推荐模型训练方法，其特征在于，所述第二任务包括标签生成任务，第二任务输出是所述训练样本的标签，基于所述标签，计算第二任务损失，所述第二任务损失是监督微调对应的损失函数。

4.根据权利要求1所述的内容推荐模型训练方法，其特征在于，所述组成内容包括标题内容、正文内容、话题内容、类目内容中的至少一种。

5.根据权利要求1至4任一项所述的内容推荐模型训练方法，其特征在于，所述获取所述训练样本对应的任务提示，包括：

6.根据权利要求5所述的内容推荐模型训练方法，其特征在于，所述第一任务输出中还包括设置的压缩占位符；

7.根据权利要求5所述的内容推荐模型训练方法，其特征在于，所述任务描述信息中还包括所述第二任务生成的目标标签的预设类型，以及所述目标标签的标签个数。

8.根据权利要求5所述的内容推荐模型训练方法，其特征在于，所述训练样本来自于训练样本对，一个所述训练样本对中包括两个相似的训练样本；

9.根据权利要求8所述的内容推荐模型训练方法，其特征在于，所述基于训练样本获取所述训练样本对应的任务提示之前，还包括：

10.根据权利要求9所述的内容推荐模型训练方法，其特征在于，所述候选训练样本对的目标用户交互行为信息包括针对所述候选训练样本对进行所述目标交互行为的目标用户；

11.一种内容推荐方法，其特征在于，应用于服务端，包括：

12.根据权利要求11所述的内容推荐方法，其特征在于，所述基于所述目标内容，构建目标任务提示，包括：

13.根据权利要求12所述的内容推荐方法，其特征在于，所述任务输出包括第一任务输出，所述第一任务输出中还包括设置的压缩占位符；

14.根据权利要求11所述的内容推荐方法，其特征在于，所述方法，还包括：

15.一种内容推荐方法，其特征在于，应用于客户端，包括：

16.一种内容推荐模型训练装置，其特征在于，包括：

17.一种内容推荐装置，其特征在于，应用于服务端，包括：

18.一种内容推荐装置，其特征在于，应用于客户端，包括：

19.一种电子设备，其特征在于，包括处理器和存储器，其中，所述存储器存储有计算机程序，当所述计算机程序被所述处理器执行时，使得所述处理器执行权利要求1～10中任一项所述内容推荐模型训练方法的步骤，或者，使得所述处理器执行权利要求11～14中任一项所述内容推荐方法的步骤，或者，使得所述处理器执行权利要求15所述内容推荐方法的步骤。

20.一种存储介质，其特征在于，包括计算机程序，当所述计算机程序在电子设备上运行时，所述计算机程序用于使所述电子设备执行权利要求1～10中任一项所述内容推荐模型训练方法的步骤，或者，所述计算机程序用于使所述电子设备执行权利要求11～14中任一项所述内容推荐方法的步骤，或者，所述计算机程序用于使所述电子设备执行权利要求15所述内容推荐方法的步骤。

技术总结
本申请实施例公开了一种内容推荐模型训练方法，内容推荐方法及相关设备，可通过基于训练样本获取训练样本对应的任务提示，任务提示指示执行第一任务和至少一个第二任务，第一任务和第二任务的至少部分处理相似，任务提示还包括训练样本的至少部分组成内容；将任务提示输入待训练的内容推荐模型，以便内容推荐模型针对训练样本执行第一任务和执行第二任务；基于内容推荐模型执行第一任务和第二任务所得到的任务输出、第一任务损失和第二任务损失，对内容推荐模型进行训练，直到得到训练好的内容推荐模型。通过任务提示集成至少两个任务，增加内容推荐模型生成信息增益，从而提高推荐内容的精确性。

技术研发人员：张超,张浩鑫,吴世伟,高龑
受保护的技术使用者：书行科技（北京）有限公司
技术研发日：
技术公布日：2024/6/26

转载请注明原文地址:https://doc.8miu.com/index.php/read-1820490.html

专利

最新回复(0)