点击率预测模型的训练方法、点击率预测方法和装置与流程

专利2025-07-16  10


本申请实施例涉及计算机,尤其涉及一种点击率预测模型的训练方法、点击率预测方法和装置。


背景技术:

1、随着互联网的高速发展,用户可以通过互联网获取需要的对象,诸如物品、广告或其他信息等。但因为互联网中存在大量数据信息,如何向用户提供需要的对象成为提升用户满意度的关键因素。

2、相关技术中,可通过点击率预测模型预测用户点击任意对象的概率,进而根据预测的点击率向用户进行对象推荐。然而,目前点击率预测模型的训练主要依赖用户行为序列,但因为用户行为序列服从长尾分布,其中在互联网中进行大量交互行为的用户为活跃用户(即头部用户),在互联网中进行少量交互行为的用户为不活跃用户(即尾部用户),并且尾部用户的用户行为序列的数量较为稀少,那么基于用户行为序列训练点击率预测模型时,就无法充分学习尾部用户的用户行为序列,导致训练得到的点击率预测模型预测的点击率准确性较差。


技术实现思路

1、本申请实施例提供一种点击率预测模型的训练方法、点击率预测方法和装置,可以提高点击率预测模型预测的点击率准确性。

2、第一方面,本申请实施例提供了一种点击率预测模型的训练方法,所述点击率预测模型包括辅助预测模块和主要预测模块,所述训练方法包括:

3、获取训练样本以及与所述训练样本对应的标签值,所述训练样本包括用户行为序列、用户特征信息和目标对象特征信息,所述标签值用于表示所述训练样本的点击信息;

4、将所述用户行为序列输入所述辅助预测模块,得到所述辅助预测模块输出的成对预测值;

5、将所述用户行为序列和目标特征信息输入所述主要预测模块,得到所述主要预测模块输出的点击率预测值,所述目标特征信息包括所述用户特征信息、所述目标对象特征信息以及根据所述用户特征信息和所述目标对象特征信息确定的交叉特征信息;

6、根据所述成对预测值、所述标签值和所述点击率预测值,对所述点击率预测模型进行训练。

7、第二方面,本申请实施例提供了一种点击率预测方法,包括:

8、获取用户特征信息、目标对象特征信息和用户历史行为信息;

9、将所述用户特征信息、所述目标对象特征信息和所述用户历史行为信息输入目标点击率预测模型中,得到所述用户对所述目标对象的点击率预测值;

10、其中,所述目标点击率预测模型根据第一方面实施例所述的方法训练得到。

11、第三方面,本申请实施例提供了一种点击率预测模型的训练装置,所述点击率预测模型包括辅助预测模块和主要预测模块,包括:

12、第一获取模块,用于获取训练样本以及与所述训练样本对应的标签值,所述训练样本包括用户行为序列、用户特征信息和目标对象特征信息,所述标签值用于表示所述训练样本的点击信息;

13、第二获取模块,用于将所述用户行为序列输入所述辅助预测模块,得到所述辅助预测模块输出的成对预测值;

14、第三获取模块,用于将所述用户行为序列和目标特征信息输入所述主要预测模块,得到所述主要预测模块输出的点击率预测值,所述目标特征信息包括所述用户特征信息、所述目标对象特征信息以及根据所述用户特征信息和所述目标对象特征信息确定的交叉特征信息;

15、模型训练模块,用于根据所述成对预测值、所述标签值和所述点击率预测值,对所述点击率预测模型进行训练。

16、第四方面,本申请实施例提供了一种点击率预测装置,包括:

17、信息获取模块,用于获取用户特征信息、目标对象特征信息和用户历史行为信息;

18、预测模块,用于将所述用户特征信息、所述目标对象特征信息和所述用户历史行为信息输入目标点击率预测模型中,得到所述用户对所述目标对象的点击率预测值;

19、其中,所述目标点击率预测模型根据第三方面实施例所述的装置训练得到。

20、第五方面,本申请实施例提供了一种电子设备,包括:

21、处理器和存储器,所述存储器用于存储计算机程序,所述处理器用于调用并运行所述存储器中存储的计算机程序,以执行如前述第一方面实施例所述的点击率预测模型的训练方法,或者如前述第二方面实施例所述的点击率预测方法。

22、第六方面,本申请实施例提供了一种计算机可读存储介质,用于存储计算机程序,所述计算机程序使得计算机执行如前述第一方面实施例所述的点击率预测模型的训练方法,或者如前述第二方面实施例所述的点击率预测方法。

23、第七方面,本申请实施例提供了一种包含程序指令的计算机程序产品,当所述程序指令在电子设备上运行时,使得所述电子设备执行如前述第一方面实施例所述的点击率预测模型的训练方法,或者如前述第二方面实施例所述的点击率预测方法。

24、本申请实施例公开的技术方案,通过获取训练样本以及与训练样本对应的标签值,并将训练样本内的用户行为序列输入辅助预测模块,得到辅助预测模块输出的成对预测值,以及将用户行为序列和目标特征信息输入主要预测模块,得到主要预测模块输出的点击预测值,进而根据成对预测值、标签值和点击率预测值,对点击率预测模型进行训练。本申请实施例通过在点击率预测模型的现有结构上增加辅助预测模块,以通过辅助预测模块对尾部用户的少量用户行为序列进行充分学习,使得点击率预测模型在充分学习头部用户的用户行为序列基础上,可以充分学习尾部用户的用户行为序列,从而能够充分利用不同用户的行为数据,提高点击率预测模型预测的点击率准确性。



技术特征:

1.一种点击率预测模型的训练方法,其特征在于,所述点击率预测模型包括辅助预测模块和主要预测模块,所述训练方法包括:

2.根据权利要求1所述的方法,其特征在于,所述辅助预测模块包括第一处理单元、融合单元和第二处理单元,所述将所述用户行为序列输入所述辅助预测模块,得到所述辅助预测模块输出的成对预测值,包括:

3.根据权利要求2所述的方法,其特征在于,所述通过所述第一处理单元根据所述对象特征向量,确定成对输出结果,包括:

4.根据权利要求2所述的方法,其特征在于,所述第一查询向量和第二查询是对目标查询向量进行成对次数的丢弃处理后得到的,所述目标查询向量基于所述用户特征信息、所述目标对象特征信息以及当前行为的搜索词得到。

5.根据权利要求2所述的方法,其特征在于,所述第二处理单元为多层感知机网络。

6.根据权利要求1所述的方法,其特征在于,所述主要预测模块包括兴趣识别单元和预测单元,所述将所述用户行为序列和目标特征信息输入所述主要预测模块,得到所述主要预测模块输出的点击率预测值,包括:

7.根据权利要求1所述的方法,其特征在于,所述成对预测值包括第一预测值和第二预测值,所述根据所述成对预测值、所述标签值和所述点击率预测值,对所述点击率预测模型进行训练,包括:

8.根据权利要求7所述的方法,其特征在于,所述根据所述第一损失、所述第二损失、所述第三损失和所述第四损失,对所述点击率预测模型进行训练包括:

9.一种点击率预测方法,其特征在于,包括:

10.一种点击率预测模型的训练装置,其特征在于,所述点击率预测模型包括辅助预测模块和主要预测模块,包括:

11.一种点击率预测装置,其特征在于,包括:

12.一种电子设备,其特征在于,包括:

13.一种计算机可读存储介质,其特征在于,用于存储计算机程序,所述计算机程序使得计算机执行如权利要求1至9中任一项所述的方法。

14.一种包含程序指令的计算机程序产品,其特征在于,当所述程序指令在电子设备上运行时,使得所述电子设备执行如权利要求1至9中任一项所述的方法。


技术总结
本申请提供了一种点击率预测模型的训练方法、点击率预测方法和装置,其中点击率预测模型包括辅助预测模块和主要预测模块,训练方法包括:获取训练样本以及与训练样本对应的标签值,训练样本包括用户行为序列、用户特征信息和目标对象特征信息,标签值用于表示训练样本的点击信息;将用户行为序列输入辅助预测模块,得到辅助预测模块输出的成对预测值;将用户行为序列和目标特征信息输入主要预测模块,得到主要预测模块输出的点击率预测值;根据成对预测值、标签值和点击率预测值,对点击率预测模型进行训练。本申请可以提高点击率预测模型预测的点击率准确性。

技术研发人员:詹诗意,马思怡,马艺源,周珣
受保护的技术使用者:抖音视界有限公司
技术研发日:
技术公布日:2024/6/26
转载请注明原文地址:https://doc.8miu.com/read-1822590.html

最新回复(0)