数据推荐方法、装置、服务器及存储介质与流程

专利2022-05-09  75


本公开涉及计算机技术领域,尤其涉及一种数据推荐方法、装置、服务器及存储介质。



背景技术:

随着计算机技术的发展,多媒体数据的种类越来越多,例如视频、文本、图像等。通常会基于推荐模型,对多媒体数据进行推荐,以保证多媒体数据的推荐效果。

相关技术中,通常会为多个数据提供方设置同一个推荐模型,基于该推荐模型,对多个数据提供方提供的多媒体数据进行推荐。由于上述方式中多个数据提供方共用一种推荐模型,无法实现个性化推荐,推荐效果差。



技术实现要素:

本公开提供了一种数据推荐方法、装置、服务器及存储介质,提升了推荐效果。

根据本公开实施例的一方面,提供一种数据推荐方法,所述数据推荐方法包括:

获取数据提供方提供的条件信息,所述条件信息表示允许向满足所述条件信息的标识推荐所述数据提供方提供的多媒体数据;

获取样本标识数据,所述样本标识数据至少包括满足所述条件信息的正样本标识数据;

根据所述样本标识数据对标识筛选模型进行训练,训练后的标识筛选模型用于筛选满足所述条件信息的标识;

基于所述训练后的标识筛选模型,对所述数据提供方提供的多媒体数据进行推荐。

本公开实施例提供的数据推荐方法,在获取到数据提供方提供的条件信息后,结合该条件信息来获取样本标识数据,为该数据提供方训练一个标识筛选模型,实现了标识筛选模型的个性化训练,保证了标识筛选模型与该数据提供方提供的条件信息相匹配,使得标识筛选模型能够筛选出满足该条件信息的标识。之后即可基于训练后的标识筛选模型将该数据提供方提供的多媒体数据推荐给满足数据提供方要求的标识,提高了数据推荐的准确性,保证了数据推荐效果。

在一些实施例中,所述条件信息包括多个标识;所述获取样本标识数据,包括:

从数据库中查询所述多个标识对应的标识数据,将查询到的标识数据确定为所述正样本标识数据,所述数据库用于存储至少一个标识及所述至少一个标识的标识数据。

本公开实施例提供的数据推荐方法,基于数据提供方提供的标识,来获取该标识对应的正样本标识数据,使得正样本标识数据满足条件信息,以便后续基于正样本标识数据训练的标识筛选模型与该条件信息相匹配,基于训练后的标识筛选模型能够筛选出满足条件信息的标识,从而保证了标识筛选模型的准确性。

在一些实施例中,所述条件信息包括的多个标识为所述数据提供方确定的第一标识,所述数据库用于存储本端服务器注册的至少一个第二标识及所述至少一个第二标识对应的标识数据;所述从数据库中查询所述多个标识对应的标识数据,包括:

对于任一第一标识,从所述数据库中查询包含所述第一标识的标识数据,将查询到的标识数据确定为所述正样本标识数据。

本公开实施例提供的数据推荐方法,实现了一种多方数据联合的方式,基于数据提供方提供的标识,与本端服务器对应的数据库相结合,来获取该标识对应的正样本标识数据,使得正样本标识数据满足条件信息,以便后续基于正样本标识数据训练的标识筛选模型与该条件信息相匹配,基于训练后的标识筛选模型能够筛选出满足条件信息的标识,从而保证了标识筛选模型的准确性。

在一些实施例中,所述条件信息包括标识特征;所述获取样本标识数据,包括:

从数据库中查询与所述标识特征匹配的标识数据,将查询到的标识数据确定为所述正样本标识数据,所述数据库用于存储至少一个标识及所述至少一个标识的标识数据。

本公开实施例提供的数据推荐方法,基于数据提供方提供的标识特征,从数据库中获取与标识特征匹配的正样本标识数据,实现了一种多方数据联合获取样本标识数据的方案。

在一些实施例中,所述样本标识数据还包括不满足所述条件信息的负样本标识数据;所述获取样本标识数据,还包括:

从所述数据库中除所述正样本标识数据之外的标识数据中,选取至少一个标识数据;

将选取的所述至少一个标识数据,确定为所述负样本标识数据。

本公开实施例提供的数据推荐方法,选取满足条件信息的正样本标识数据及不满足数条件的负样本标识数据,以便后续能够根据正样本标识数据及负样本标识数据来训练标识筛选模型,以使标识筛选模型能够将正样本标识数据及负样本标识数据区分开,保证了训练后的标识筛选模型筛选出的标识满足条件信息,从而保证标识筛选模型的准确性。

在一些实施例中,所述根据所述样本标识数据对标识筛选模型进行训练,包括:

响应于所述正样本标识数据在所述样本标识数据中的数量占比不小于占比阈值,根据所述正样本标识数据及所述负样本标识数据,对所述标识筛选模型进行训练。

本公开实施例提供的数据推荐方法,仅在正样本标识数据对应的数量占比不小于占比阈值的情况下,基于样本标识数据对标识筛选模型进行训练,使得样本标识数据中正样本标识数据的数量与负样本标识数据的数量趋于平衡,避免了由于正样本标识数据的在样本标识数据中的数量占比过少而导致标识筛选模型的准确率低的问题,从而保证了训练的标识筛选模型的准确性。

在一些实施例中,所述样本标识数据包括多个维度的标识数据;所述根据所述样本标识数据对标识筛选模型进行训练,包括:

对所述样本标识数据中的所述多个维度的标识数据进行特征提取,得到所述样本标识数据对应的特征信息,所述特征信息中包括所述多个维度的特征;

对所述特征信息中的所述多个维度的特征进行加权融合,得到所述样本标识数据的融合特征;

根据所述样本标识数据的融合特征,对所述标识筛选模型进行训练。

本公开实施例提供的数据推荐方法,通过对样本标识数据的特征信息中多个维度的特征进行加权处理,以增强多个维度中重要维度的特征,以信息增益的方式来对特征进行有效的选择,提高了样本标识数据的融合特征的准确性,之后基于样本标识数据的融合特征来训练标识筛选模型,提高了训练后的标识筛选模型的准确性。

在一些实施例中,所述根据所述样本标识数据对标识筛选模型进行训练,包括:

响应于所述正样本标识数据的数量不小于数量阈值,根据所述样本标识数据,对所述标识筛选模型进行训练。

本公开实施例提供的数据推荐方法,在正样本标识数据的数量不小于数量阈值的情况下,根据样本标识数据对标识筛选模型进行训练,避免了由于正样本标识数据的数量过少而导致标识筛选模型的准确率低的问题,提高了训练的标识筛选模型的准确性。

在一些实施例中,所述获取样本标识数据之后,所述数据推荐方法还包括:

响应于所述正样本标识数据的数量小于所述数量阈值,向登录所述数据提供方的标识的目标设备发送条件信息更新请求,所述目标设备用于根据所述条件信息更新请求,对所述条件信息进行更新,返回更新后的条件信息;

接收所述目标设备返回的所述更新后的条件信息,基于所述更新后的条件信息重新获取样本标识数据。

本公开实施例提供的数据推荐方法,在获取到的正样本标识数据的数量小于数量阈值的情况下,本端设备通过与数据提供方对应的目标设备之间进行交互,以使数据提供方来更新条件信息,以使本端设备能够获取到足够多的正样本标识数据,以保证后续标识筛选模型的训练效果。

在一些实施例中,

所述目标设备用于根据所述条件信息更新请求,在所述条件信息中添加多个标识,得到所述更新后的条件信息;或者,

所述目标设备用于根据所述条件信息更新请求,在所述条件信息中添加多个标识特征,得到所述更新后的条件信息。

本公开实施例提供的数据推荐方法,目标设备能够采取多种方式来更新条件信息,以便后续本端设备能够基于更新后的条件信息来获取到足够多的正样本标识数据,以保证后续标识筛选模型的训练效果。

在一些实施例中,所述获取数据提供方提供的条件信息,包括:

接收登录所述数据提供方的标识的目标设备发送的配置文件;

对所述配置文件进行解析,得到所述条件信息。

本公开实施例提供的数据推荐方法,通过本端设备与数据提供方对应的目标设备进行交互,来获取数据提供方提供的条件信息,保证了数据对接的便捷性。

在一些实施例中,所述获取数据提供方对应的条件信息,包括:

从文件数据库中查询所述数据提供方的标识对应的配置文件,所述文件数据库用于存储至少一个数据提供方的标识及对应的配置文件;

对查询到的配置文件进行解析,得到所述条件信息。

本公开实施例提供的数据推荐方法,提供了一种用于存储数据提供方提供的配置文件的文件数据库,本端设备能够基于文件数据库来获取到任一数据提供方提供的条件信息,保证了本端设备获取条件信息的便捷性。

在一些实施例中,所述根据所述样本标识数据对标识筛选模型进行训练,包括:

根据所述样本标识数据对所述标识筛选模型进行迭代训练;

响应于所述标识筛选模型的准确率大于准确率阈值,停止对所述标识筛选模型进行训练。

本公开实施例提供的数据推荐方法,通过设置准确率阈值,以保证训练得到的标识筛选模型的准确率足够高,以使训练后的标识筛选模型能够筛选出满足条件信息的标识。

在一些实施例中,所述根据所述样本标识数据对标识筛选模型进行训练之后,所述数据推荐方法还包括:

将所述训练后的标识筛选模型与所述数据提供方的标识对应存储。

本公开实施例提供的数据推荐方法,通过将训练后的标识筛选模型与数据提供方的标识对应存储,后续能够根据数据提供方的标识,来确定属于该数据提供方的标识筛选模型,以使后续在推荐多媒体数据时,能够准确查询到数据提供方对应的标识筛选模型进行数据推荐,从而保证了数据推荐的准确性。

在一些实施例中,所述基于所述训练后的标识筛选模型,对所述数据提供方提供的多媒体数据进行推荐,包括:

获取所述数据提供方提供的多媒体数据;

基于所述训练后的标识筛选模型,对多个标识的标识数据进行处理,得到每个标识的推荐概率,所述多个标识为在当前时刻之前的目标时长内登录的标识;

根据所述每个标识的推荐概率,从所述多个标识中选取目标标识;

将所述多媒体数据推荐给所述目标标识。

本公开实施例提供的数据推荐方法,通过选取在当前时刻之前的目标时长内登录的标识,并根据标识的推荐概率来推荐多媒体数据,以保证被推荐的目标标识为满足条件信息的标识,且目标标识为活跃标识,以增强目标标识查看推荐的多媒体数据的可能性,保证了多媒体数据的推荐效果。

在一些实施例中,所述根据所述每个标识的推荐概率,从所述多个标识中选取目标标识,包括:

从所述多个标识中选取目标数量的目标标识,所述目标标识的推荐概率大于所述多个标识中其他标识的推荐概率;或者,

从所述多个标识数据中选取推荐概率大于目标概率的目标标识。

本公开实施例提供的数据推荐方法,提供了多种选取标识的方式,选取推荐概率较大的标识作为多媒体数据的推荐对象,使得选取的标识满足数据提供方提供的条件信息,保证了后续多媒体数据的推荐效果。

在一些实施例中,所述基于所述训练后的标识筛选模型,对多个标识的标识数据进行处理,得到每个标识的推荐概率之前,所述方法还包括:

根据数据库中包括的多个标识的标识数据,从所述多个标识中选取在当前时刻之前的所述目标时长内登录的多个标识。

本公开实施例提供的数据推荐方法,通过预先选取登录活跃的标识,后续从中选取多媒体数据的推荐对象,以增强目标标识查看推荐的多媒体数据的可能性,保证了后续多媒体数据的推荐效果。

在一些实施例中,所述目标标识包括多个;所述基于所述训练后的标识筛选模型,对所述数据提供方提供的多媒体数据进行推荐之后,所述数据推荐方法还包括:

根据所述多个目标标识的操作记录,确定所述多个目标标识中对所述多媒体数据执行目标操作的标识的数量;

将所述数量与所述多个目标标识的数量之间的比值,确定为转化率;

响应于所述转化率小于转化率阈值,对所述训练后的标识筛选模型进行重新训练。

本公开实施例提供的数据推荐方法,转化率代表着多媒体数据的推荐效果,转化率小于转化率阈值,表示多媒体数据的推荐效果差,需要重新对标识筛选模型进行训练,以便后续能够基于重新训练后的标识筛选模型对多媒体数据进行推荐,以提升多媒体数据的推荐效果。

在一些实施例中,所述响应于所述转化率小于转化率阈值,对所述训练后的标识筛选模型进行重新训练,包括:

响应于所述转化率小于转化率阈值,增大所述标识筛选模型的准确率阈值;

基于增大后的准确率阈值,对所述训练后的标识筛选模型进行重新训练,以使重新训练后的标识筛选模型的准确率大于所述增大后的准确率阈值。

本公开实施例提供的数据推荐方法,提供了一种优化标识筛选模型的方式,通过增大的准确率阈值,来对标识筛选模型进行重新训练,以提升重新训练后的标识筛选模型的准确率。

在一些实施例中,所述获取所述数据提供方提供的多媒体数据,包括:

接收目标设备发送的所述多媒体数据,所述目标设备为登录所述数据提供方的标识的设备。

本公开实施例提供的数据推荐方法,本端设备通过与目标设备之间交互的方式,来获取数据提供方提供的多媒体数据,保证了数据交互的便捷性。

在一些实施例中,所述获取所述数据提供方提供的多媒体数据,包括:

从多媒体数据库中查询所述数据提供方提供的所述多媒体数据,所述多媒体数据库用于存储待推荐的多媒体数据及对应的数据提供方的标识。

本公开实施例提供的数据推荐方法,通过设置一种多媒体数据库,本端设备能够基于文件数据库来获取到数据提供方提供的多媒体数据,保证了本端设备获取多媒体数据的便捷性。

根据本公开实施例的再一方面,提供一种数据推荐装置,所述装置包括:

获取单元,被配置为执行获取数据提供方提供的条件信息,所述条件信息表示允许向满足所述条件信息的标识推荐所述数据提供方提供的多媒体数据;

所述获取单元,被配置为执行获取样本标识数据,所述样本标识数据至少包括满足所述条件信息的正样本标识数据;

训练单元,被配置为执行根据所述样本标识数据对标识筛选模型进行训练,训练后的标识筛选模型用于筛选满足所述条件信息的标识;

推荐单元,被配置为执行基于所述训练后的标识筛选模型,对所述数据提供方提供的多媒体数据进行推荐。

在一些实施例中,所述条件信息包括多个标识;所述获取单元,包括:

确定子单元,被配置为执行从数据库中查询所述多个标识对应的标识数据,将查询到的标识数据确定为所述正样本标识数据,所述数据库用于存储至少一个标识及所述至少一个标识的标识数据。

在一些实施例中,所述条件信息包括的多个标识为所述数据提供方确定的第一标识,所述数据库用于存储本端服务器注册的至少一个第二标识及所述至少一个第二标识对应的标识数据;所述确定子单元,被配置为执行对于任一第一标识,从所述数据库中查询包含所述第一标识的标识数据,将查询到的标识数据确定为所述正样本标识数据。

在一些实施例中,所述条件信息包括标识特征;所述获取单元,包括:

确定子单元,被配置为执行从数据库中查询与所述标识特征匹配的标识数据,将查询到的标识数据确定为所述正样本标识数据,所述数据库用于存储至少一个标识及所述至少一个标识的标识数据。

在一些实施例中,所述样本标识数据还包括不满足所述条件信息的负样本标识数据;所述获取单元,还包括:

第一选取子单元,被配置为执行从所述数据库中除所述正样本标识数据之外的标识数据中,选取至少一个标识数据;

确定子单元,被配置为执行将选取的所述至少一个标识数据,确定为所述负样本标识数据。

在一些实施例中,所述训练单元,包括:

训练子单元,被配置为执行响应于所述正样本标识数据在所述样本标识数据中的数量占比不小于占比阈值,根据所述正样本标识数据及所述负样本标识数据,对所述标识筛选模型进行训练。

在一些实施例中,所述样本标识数据包括多个维度的标识数据;所述训练单元,包括:

特征提取子单元,被配置为执行对所述样本标识数据中的所述多个维度的标识数据进行特征提取,得到所述样本标识数据对应的特征信息,所述特征信息中包括所述多个维度的特征;

加权融合子单元,被配置为执行对所述特征信息中的所述多个维度的特征进行加权融合,得到所述样本标识数据的融合特征;

训练子单元,被配置为执行根据所述样本标识数据的融合特征,对所述标识筛选模型进行训练。

在一些实施例中,所述训练单元,包括:

训练子单元,被配置为执行响应于所述正样本标识数据的数量不小于数量阈值,根据所述样本标识数据,对所述标识筛选模型进行训练。

在一些实施例中,所述数据推荐装置还包括:

发送单元,被配置为执行响应于所述正样本标识数据的数量小于所述数量阈值,向登录所述数据提供方的标识的目标设备发送条件信息更新请求,所述目标设备用于根据所述条件信息更新请求,对所述条件信息进行更新,返回更新后的条件信息;

接收单元,被配置为执行接收所述目标设备返回的所述更新后的条件信息,基于所述更新后的条件信息重新获取样本标识数据。

在一些实施例中,

所述目标设备用于根据所述条件信息更新请求,在所述条件信息中添加多个标识,得到所述更新后的条件信息;或者,

所述目标设备用于根据所述条件信息更新请求,在所述条件信息中添加多个标识特征,得到所述更新后的条件信息。

在一些实施例中,所述获取单元,包括:

接收子单元,被配置为执行接收登录所述数据提供方的标识的目标设备发送的配置文件;

解析子单元,被配置为执行对所述配置文件进行解析,得到所述条件信息。

在一些实施例中,所述获取单元,包括:

查询子单元,被配置为执行从文件数据库中查询所述数据提供方的标识对应的配置文件,所述文件数据库用于存储至少一个数据提供方的标识及对应的配置文件;

解析子单元,被配置为执行对查询到的配置文件进行解析,得到所述条件信息。

在一些实施例中,所述训练单元,包括:

训练子单元,被配置为执行根据所述样本标识数据对所述标识筛选模型进行迭代训练;

所述训练子单元,被配置为执行响应于所述标识筛选模型的准确率大于准确率阈值,停止对所述标识筛选模型进行训练。

在一些实施例中,所述数据推荐装置还包括:

存储单元,被配置为执行将所述训练后的标识筛选模型与所述数据提供方的标识对应存储。

在一些实施例中,所述推荐单元,包括:

获取子单元,被配置为执行获取所述数据提供方提供的多媒体数据;

处理子单元,被配置为执行基于所述训练后的标识筛选模型,对多个标识的标识数据进行处理,得到每个标识的推荐概率,所述多个标识为在当前时刻之前的目标时长内登录的标识;

第二选取子单元,被配置为执行根据所述每个标识的推荐概率,从所述多个标识中选取目标标识;

推荐子单元,被配置为执行将所述多媒体数据推荐给所述目标标识。

在一些实施例中,所述第二选取子单元,被配置为执行从所述多个标识中选取目标数量的目标标识,所述目标标识的推荐概率大于所述多个标识中其他标识的推荐概率;或者,从所述多个标识数据中选取推荐概率大于目标概率的目标标识。

在一些实施例中,所述装置还包括:

选取单元,被配置为执行根据数据库中包括的多个标识的标识数据,从所述多个标识中选取在当前时刻之前的所述目标时长内登录的多个标识。

在一些实施例中,所述目标标识包括多个;所述数据推荐装置还包括:

确定单元,被配置为执行根据所述多个目标标识的操作记录,确定所述多个目标标识中对所述多媒体数据执行目标操作的标识的数量;

所述确定单元,被配置为执行将所述数量与所述多个目标标识的数量之间的比值,确定为转化率;

所述训练单元,被配置为执行响应于所述转化率小于转化率阈值,对所述训练后的标识筛选模型进行重新训练。

在一些实施例中,所述训练单元,被配置为执行响应于所述转化率小于转化率阈值,增大所述标识筛选模型的准确率阈值;基于增大后的准确率阈值,对所述训练后的标识筛选模型进行重新训练,以使重新训练后的标识筛选模型的准确率大于所述增大后的准确率阈值。

在一些实施例中,所述获取子单元,被配置为执行接收目标设备发送的所述多媒体数据,所述目标设备为登录所述数据提供方的标识的设备。

在一些实施例中,所述获取子单元,被配置为执行从多媒体数据库中查询所述数据提供方提供的所述多媒体数据,所述多媒体数据库用于存储待推荐的多媒体数据及对应的数据提供方的标识。

根据本公开实施例的再一方面,提供了一种服务器,所述服务器包括:

一个或多个处理器;

用于存储所述一个或多个处理器可执行指令的易失性或非易失性存储器;

其中,所述一个或多个处理器被配置为执行第一方面所述的数据推荐方法。

根据本公开实施例的再一方面,提供一种非临时性计算机可读存储介质,当所述存储介质中的指令由服务器的处理器执行时,使得服务器能够执行上述方面所述的数据推荐方法。

根据本公开实施例的再一方面,提供一种计算机程序产品,当所述计算机程序产品中的指令由服务器的处理器执行时,使得服务器能够执行上述方面所述的数据推荐方法。

应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。

附图说明

此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本公开的实施例,并与说明书一起用于解释本公开的原理。

图1是根据一示例性实施例示出的一种实施环境的示意图。

图2是根据一示例性实施例示出的一种数据推荐方法的流程图。

图3是根据一示例性实施例示出的一种数据推荐方法的流程图。

图4是根据一示例性实施例示出的一种数据推荐方法的流程图。

图5是根据一示例性实施例示出的一种数据推荐装置的框图。

图6是根据一示例性实施例示出的一种数据推荐装置的框图。

图7是根据一示例性实施例示出的一种服务器的框图。

具体实施方式

为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。

需要说明的是,本公开的说明书和权利要求书及上述附图说明中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。

本公开所使用的术语“至少一个”、“多个”、“每个”、“任一”,至少一个包括一个、两个或两个以上,多个包括两个或两个以上,而每个是指对应的多个中的每一个,任一是指多个中的任意一个。举例来说,多个标识包括3个标识,而每个是指这3个标识中的每一个标识,任一是指这3个标识中的任意一个,能够是第一个标识,或者,是第二个标识,或者是第三个标识。

需要说明的是,本公开所涉及的用户信息(包括但不限于用户设备信息、用户个人信息等),均为经用户授权或者经过各方充分授权的信息。

图1是根据一示例性实施例提供的一种实施环境的示意图,该实施环境包括:多个终端101、服务器102和多个目标设备103,多个终端101能够通过与服务器102之间的网络连接进行交互,多个目标设备103能够通过与服务器102之间的网络连接进行交互。

其中,该终端101为手机、平板电脑、计算机等多种类型的终端,该服务器102为一台服务器,或者由若干服务器组成的服务器集群,或者是一个云计算服务中心。在一些实施例中,目标设备103为终端或服务器。

终端101上安装由服务器102提供服务的第一应用,终端101能够通过该第一应用实现例如数据传输、消息交互等功能。例如,第一应用为内容分享应用,该内容分享应用具有内容分享的功能,当然,该内容分享应用还能够具有其他功能,例如,点评功能、购物功能、导航功能、游戏功能等。在一些实施例中,服务器102为该第一应用的后台服务器或者为提供云计算以及云存储等服务的云服务器。每个目标设备103用于代表一个数据提供方,每个目标设备103通过网络连接与服务器102进行交互。

在一些实施例中,终端101基于标识登录该第一应用,通过该第一应用,能够与服务器102之间进行交互。其中,服务器102为本端设备,终端101对应的标识为在本端设备中注册的标识。

在一些实施例中,服务器102为一个数据管理平台,该服务器102包括至少一个服务器,该至少一个服务器构成该数据管理平台。该服务器102作为平台方,能够提供第一应用和第二应用。终端101作为用户方,终端101能够安装该第一应用,基于安装的第一应用,与服务器102进行交互,来获取服务器102中的多媒体数据。目标设备103作为数据提供方,目标设备103能够安装该第二应用,能够基于安装的第二应用,能够向服务器102发布模型训练请求,或者向服务器102上传多媒体数据或条件信息。

在一些实施例中,该数据管理平台包括多个服务器,多个服务器之间能够进行交互。其中,在多个服务器包括第一服务器和第二服务器,第一服务器为第一应用提供服务,第二服务器为该第二应用提供服务,该第一服务器与该第二服务器之间能够进行交互。

目标设备102通过与服务器102之间的网络连接,向服务器102上传条件信息或多媒体数据。服务器102用于接收目标设备102上传的条件信息,根据目标设备102上传的条件信息为目标设备102所代表的数据提供方训练一个标识筛选模型,并基于训练后的标识筛选模型,将该数据提供方提供的多媒体数据推荐给至少一个终端101,以使终端101能够展示多媒体数据供用户查看。

本公开实施例提供的方法能够应用于多种场景下。

例如,广告推荐场景下。

目标设备基于数据提供方的标识登录服务器,将条件信息及广告上传至该服务器,服务器在获取到该条件信息及广告后,采用本公开实施例提供的数据推荐方法,为该数据提供方训练一个标识筛选模型,并基于训练后的标识筛选模型,将广告推荐满足条件信息的标识,实现了广告的推荐。

图2是根据一示例性实施例示出的一种数据推荐方法的流程图,参见图2,该数据推荐方法应用于服务器中,包括以下步骤:

201、服务器获取数据提供方提供的条件信息。

其中,条件信息表示允许向满足条件信息的标识推荐数据提供方提供的多媒体数据。通过获取数据提供方提供的条件信息,以便后续基于该条件信息来为该数据提供方训练匹配的标识筛选模型。

202、服务器获取样本标识数据。

其中,样本标识数据用于为该数据提供方训练标识筛选模型,样本标识数据至少包括满足条件信息的正样本标识数据。对于样本标识数据中的任一样本标识数据,该样本标识数据包括对应的标识指示的用户所具有的特征。例如,对于任一标识数据,该标识数据包括对应的标识所指示的用户的年龄、兴趣爱好、人群类型等。

203、服务器根据样本标识数据对标识筛选模型进行训练。

其中,训练后的标识筛选模型用于筛选满足条件信息的标识。

204、服务器基于训练后的标识筛选模型,对数据提供方提供的多媒体数据进行推荐。

在为数据提供方训练完成标识筛选模型后,基于该标识筛选模型对该数据提供方提供的多媒体数据进行推荐,以保证多媒体数据的推荐效果。

本公开实施例提供的数据推荐方法,在获取到数据提供方提供的条件信息后,结合该条件信息来获取样本标识数据,为该数据提供方训练一个标识筛选模型,实现了标识筛选模型的个性化训练,保证了标识筛选模型与该数据提供方提供的条件信息相匹配,使得标识筛选模型能够筛选出满足该条件信息的标识。之后即可基于训练后的标识筛选模型将该数据提供方提供的多媒体数据推荐给满足数据提供方要求的标识,提高了数据推荐的准确性,保证了数据推荐效果。

在一些实施例中,条件信息包括多个标识;获取样本标识数据,包括:

从数据库中查询多个标识对应的标识数据,将查询到的标识数据确定为正样本标识数据,数据库用于存储至少一个标识及至少一个标识的标识数据。

在一些实施例中,条件信息包括的多个标识为数据提供方确定的第一标识,数据库用于存储本端服务器注册的至少一个第二标识及至少一个第二标识对应的标识数据;从数据库中查询多个标识对应的标识数据,包括:

对于任一第一标识,从数据库中查询包含第一标识的标识数据,将查询到的标识数据确定为正样本标识数据。

在一些实施例中,条件信息包括标识特征;获取样本标识数据,包括:

从数据库中查询与标识特征匹配的标识数据,将查询到的标识数据确定为正样本标识数据,数据库用于存储至少一个标识及至少一个标识的标识数据。

在一些实施例中,样本标识数据还包括不满足条件信息的负样本标识数据;获取样本标识数据,还包括:

从数据库中除正样本标识数据之外的标识数据中,选取至少一个标识数据;

将选取的至少一个标识数据,确定为负样本标识数据。

在一些实施例中,根据样本标识数据对标识筛选模型进行训练,包括:

响应于正样本标识数据在样本标识数据中的数量占比不小于占比阈值,根据正样本标识数据及负样本标识数据,对标识筛选模型进行训练。

在一些实施例中,样本标识数据包括多个维度的标识数据;根据样本标识数据对标识筛选模型进行训练,包括:

对样本标识数据中的多个维度的标识数据进行特征提取,得到样本标识数据对应的特征信息,特征信息中包括多个维度的特征;

对特征信息中的多个维度的特征进行加权融合,得到样本标识数据的融合特征;

根据样本标识数据的融合特征,对标识筛选模型进行训练。

在一些实施例中,根据样本标识数据对标识筛选模型进行训练,包括:

响应于正样本标识数据的数量不小于数量阈值,根据样本标识数据,对标识筛选模型进行训练。

在一些实施例中,获取样本标识数据之后,数据推荐方法还包括:

响应于正样本标识数据的数量小于数量阈值,向登录数据提供方的标识的目标设备发送条件信息更新请求,目标设备用于根据条件信息更新请求,对条件信息进行更新,返回更新后的条件信息;

接收目标设备返回的更新后的条件信息,基于更新后的条件信息重新获取样本标识数据。

在一些实施例中,目标设备用于根据条件信息更新请求,在条件信息中添加多个标识,得到更新后的条件信息;或者,

目标设备用于根据条件信息更新请求,在条件信息中添加多个标识特征,得到更新后的条件信息。

在一些实施例中,获取数据提供方提供的条件信息,包括:

接收登录数据提供方的标识的目标设备发送的配置文件;

对配置文件进行解析,得到条件信息。

在一些实施例中,获取数据提供方对应的条件信息,包括:

从文件数据库中查询数据提供方的标识对应的配置文件,文件数据库用于存储至少一个数据提供方的标识及对应的配置文件;

对查询到的配置文件进行解析,得到条件信息。

在一些实施例中,根据样本标识数据对标识筛选模型进行训练,包括:

根据样本标识数据对标识筛选模型进行迭代训练;

响应于标识筛选模型的准确率大于准确率阈值,停止对标识筛选模型进行训练。

在一些实施例中,根据样本标识数据对标识筛选模型进行训练之后,数据推荐方法还包括:

将训练后的标识筛选模型与数据提供方的标识对应存储。

在一些实施例中,基于训练后的标识筛选模型,对数据提供方提供的多媒体数据进行推荐,包括:

获取数据提供方提供的多媒体数据;

基于训练后的标识筛选模型,对多个标识的标识数据进行处理,得到每个标识的推荐概率,多个标识为在当前时刻之前的目标时长内登录的标识;

根据每个标识的推荐概率,从多个标识中选取目标标识;

将多媒体数据推荐给目标标识。

在一些实施例中,根据每个标识的推荐概率,从多个标识中选取目标标识,包括:

从多个标识中选取目标数量的目标标识,目标标识的推荐概率大于多个标识中其他标识的推荐概率;或者,

从多个标识数据中选取推荐概率大于目标概率的目标标识。

在一些实施例中,基于训练后的标识筛选模型,对多个标识的标识数据进行处理,得到每个标识的推荐概率之前,方法还包括:

根据数据库中包括的多个标识的标识数据,从多个标识中选取在当前时刻之前的目标时长内登录的多个标识。

在一些实施例中,目标标识包括多个;基于训练后的标识筛选模型,对数据提供方提供的多媒体数据进行推荐之后,数据推荐方法还包括:

根据多个目标标识的操作记录,确定多个目标标识中对多媒体数据执行目标操作的标识的数量;

将数量与多个目标标识的数量之间的比值,确定为转化率;

响应于转化率小于转化率阈值,对训练后的标识筛选模型进行重新训练。

在一些实施例中,响应于转化率小于转化率阈值,对训练后的标识筛选模型进行重新训练,包括:

响应于转化率小于转化率阈值,增大标识筛选模型的准确率阈值;

基于增大后的准确率阈值,对训练后的标识筛选模型进行重新训练,以使重新训练后的标识筛选模型的准确率大于增大后的准确率阈值。

在一些实施例中,获取数据提供方提供的多媒体数据,包括:

接收目标设备发送的多媒体数据,目标设备为登录数据提供方的标识的设备。

在一些实施例中,获取数据提供方提供的多媒体数据,包括:

从多媒体数据库中查询数据提供方提供的多媒体数据,多媒体数据库用于存储待推荐的多媒体数据及对应的数据提供方的标识。

图3是根据一示例性实施例示出的一种数据推荐方法的流程图,参见图3,该数据推荐方法应用于服务器中,包括以下步骤:

301、服务器从文件数据库中查询数据提供方的标识对应的配置文件。

其中,文件数据库用于存储至少一个数据提供方的标识及对应的配置文件,该配置文件是由数据提供方提供的,该数据提供方提供的配置文件用于为该数据提供方训练标识筛选模型。该配置文件中包括条件信息,该条件信息表示允许向满足条件信息的标识推荐数据提供方提供的多媒体数据。在一些实施例中,在该文件数据库中,该配置文件是以文本形式存储的,或者,以其他形式存储的。

在本公开实施例中,为每个数据提供方提供一个标识,将每个数据提供方提供的配置文件与对应的数据提供方的标识对应存储于文件数据库中,以便后续在为任一数据提供方训练标识筛选模型时,能够从该文件数据库中查询数据提供方提供的配置文件。

在一些实施例中,该文件数据库存储于该服务器本地,则该服务器在获取到数据提供方的标识后,查询本地的文件数据库,得到该数据提供方的标识对应的配置文件。

在上述实施例的一种可能实现方式中,在文件数据库中存储配置文件的过程包括:管理人员基于该服务器,将数据提供方的标识及配置文件上传至该文件数据库中,将数据提供方的标识与配置文件对应存储。

在一些实施例中,该文件数据库存储于数据服务器中,则该301包括:服务器向数据服务器发送文件获取请求,该文件获取请求携带该数据提供方的标识,数据服务器接收到该文件获取请求后,从该数据服务器的文件数据库中,查询该数据提供方的标识对应的配置文件,向该服务器发送该配置文件,该服务器接收该配置文件。其中,该服务器与数据服务器属于一个数据管理平台中,该数据管理平台包括多个服务器,该多个服务器之间能够进行交互。

在上述实施例的一种可能实现方式中,在文件数据库中存储配置文件的过程包括:该数据服务器的管理人员基于该数据服务器,将数据提供方的标识及配置文件上传至该文件数据库中,将数据提供方的标识与配置文件对应存储。

302、服务器对查询到的配置文件进行解析,得到条件信息。

其中,条件信息表示允许向满足条件信息的标识推荐数据提供方提供的多媒体数据,该配置文件中包括该条件信息。通过采用文件解析的方式,从数据提供方对应的配置文件中,提取出条件信息,以便后续基于该条件信息,为该数据提供方训练标识筛选模型。本公开实施例提供的数据推荐方法,提供了一种用于存储数据提供方提供的配置文件的文件数据库,本端设备能够基于文件数据库来获取到任一数据提供方提供的条件信息,保证了本端设备获取条件信息的便捷性。

在一些实施例中,该条件信息包括多个标识。其中,该多个标识是由该数据提供方提供的,即该数据提供方允许向该多个标识推荐该数据提供方提供的多媒体数据,该多个标识用于指示多个用户。

在一些实施例中,该条件信息包括标识特征。其中,该标识特征是由该数据提供方提供的,即该数据提供方允许向符合该标识特征的标识推荐该数据提供方提供的多媒体数据。例如,该标识特征为性别、年龄段等。

需要说明的是,上述实施例中仅是以条件信息仅包括多个标识,或者,条件信息仅包括标识特征进行说明的,而在另一实施例中,条件信息不仅能够包括多个标识,还能包括标识特征,以便后续服务器基于该条件信息获取到正样本标识数据。

需要说明的是,本公开实施例是先从文件数据库中获取数据提供方对应的配置文件,再从配置文件中获取条件信息的,而在另一实施例中,无需执行步骤301-302,能够采取其他方式,获取数据提供方提供的条件信息。

在一些实施例中,获取条件信息的过程包括:接收登录数据提供方的标识的目标设备发送的配置文件,对配置文件进行解析,得到条件信息。

其中,目标设备为任意设备,如终端或服务器等。在数据提供方需要服务器为自己训练一个标识筛选模型时,通过目标设备,向服务器发送配置文件,服务器接收该配置文件,并采用文件解析的方式,从配置文件中获取条件信息,以便后续基于该条件信息,为该数据提供方训练一个标识筛选模型。通过本端设备与数据提供方对应的目标设备进行交互,来获取数据提供方提供的条件信息,保证了数据对接的便捷性。

在上述实施例的一种可能实现方式中,目标设备上安装有第二应用,该服务器是为该第二应用提供服务的服务器。目标设备通过第二应用,将配置文件上传至该服务器,则该服务器接收到该配置文件。

303、服务器获取样本标识数据。

其中,样本标识数据为用于为该数据提供方训练标识筛选模型的标识数据,该样本标识数据是基于条件信息获取到的,该样本标识数据至少包括满足条件信息的正样本标识数据。对于样本标识数据中的任一标识数据,该标识数据用于指示描述对应的标识所具有的特征。例如,对于任一标识数据,该标识数据对应的标识指示用户,即该标识数据为描述该用户的数据。

在一些实施例中,该303包括以下两种方式:

第一种方式,条件信息包括多个标识:从数据库中查询多个标识对应的标识数据,将查询到的标识数据确定为正样本标识数据。

其中,该数据库用于存储至少一个标识及至少一个标识的标识数据。例如,该数据库为该服务器的本地数据库,或者,该数据库为其他设备上的数据库。在获取到条件信息中的多个标识后,查询该数据库中包括的至少一个标识及至少一个标识的标识数据,得到该条件信息中的多个标识对应的标识数据,查询到的标识数据即为满足该条件信息的标识数据,则将查询到的标识数据确定为正样本标识数据。基于数据提供方提供的标识,来获取该标识对应的正样本标识数据,使得正样本标识数据满足条件信息,以便后续基于正样本标识数据训练的标识筛选模型与该条件信息相匹配,基于训练后的标识筛选模型能够筛选出满足条件信息的标识,从而保证了标识筛选模型的准确性。

在上述实施例的一种可能实现方式中,条件信息包括的多个标识为数据提供方确定的第一标识,数据库用于存储本端服务器注册的至少一个第二标识及至少一个第二标识对应的标识数据;则获取正样本标识数据的过程包括:对于任一第一标识,从数据库中查询包含第一标识的标识数据,将查询到的标识数据确定为正样本标识数据。

在本公开实施例中,数据库中存储的第二标识可能为用户昵称或者该服务器在用户注册时为用户生成的标识等,数据提供方确定的第一标识可能为用户昵称或者用户在其他服务器中注册的标识。无论第一标识或者第二标识,均用于指示用户的身份,其中第一标识用于指示用户在数据提供方处的用户身份,第二标识用于指示用户在本地的服务器处的用户身份。对于同一个用户,该用户对应的第一标识与该用户对应的第二标识可能相同,也可能不同,例如,任一用户对应的第一标识为第一用户昵称,该用户对应的第二标识为第二用户昵称,第一用户昵称和第二用户昵称相同,即该用户对应的第一标识与第二标识相同;第一用户昵称和第二用户昵称不同,即该第一标识与该第二标识不同。

用户通常会在不同平台上注册标识,可能会将不同平台上的标识绑定起来,或者,一个平台上的标识能够作为另一平台上的标识对应的标识数据存储下来,那么就会导致一个标识对应的标识数据中包括另一个标识,就代表着这两个标识属于同一个用户。由于第二标识用于指示一个用户,任一第二标识的标识数据中包括了该第二标识指示的用户的多种信息,则对于任一第一标识,通过查询数据库中包括的多个第二标识的标识数据,以确定包含该第一标识的标识数据,即查询到的包含第一标识的标识数据对应的第二标识与该第一标识所指示的用户为同一用户,则确定该第一标识与该第二标识对应,即该第一标识与该第二标识的标识数据对应,则将该第二标识的标识数据作为正样本标识数据。

例如,对于任一第一标识,从数据库中查询与该第一标识相同的第二标识,将查询到的第二标识的标识数据确定为正样本标识数据。其中,第一标识与第二标识相同,表示第一标识与第二标识指示同一个用户,则第二标识的标识数据也即是第一标识的标识数据,因此,将该第二标识的标识数据确定为正样本标识数据。

通过从本端服务器的数据库来查询正样本数据,实现了一种多方数据联合的方式,基于数据提供方提供的标识,与本端服务器对应的数据库相结合,来获取该标识对应的正样本标识数据,使得正样本标识数据满足条件信息,以便后续基于正样本标识数据训练的标识筛选模型与该条件信息相匹配,基于训练后的标识筛选模型能够筛选出满足条件信息的标识,从而保证了标识筛选模型的准确性。

第二种方式,条件信息包括标识特征:从数据库中查询与标识特征匹配的标识数据,将查询到的标识数据确定为正样本标识数据。

其中,该数据提供方允许向符合该条件信息包括的标识特征的标识,推荐该数据提供方提供的多媒体数据。数据库用于存储至少一个标识及至少一个标识的标识数据。通过查询该数据库中包括的多个标识的标识数据,从中选取与该标识特征匹配的标识数据,即表示选取的标识数据对应的标识满足该条件信息,因此,将选取的标识数据确定为正样本标识数据。例如,条件信息包括的标识特征指示的年龄段为25-40,数据库中的标识数据中包括对应的标识所指示的用户的年龄,则通过查询数据库中多个标识数据库,选取包含的年龄属于该年龄段的标识数据,即表示选取的标识数据对应的标识满足该条件信息,则将选取的标识数据确定为正样本标识数据。基于数据提供方提供的标识特征,从数据库中获取与标识特征匹配的正样本标识数据,实现了一种多方数据联合获取样本标识数据的方案。

在一些实施例中,条件信息包括多个标识特征,则第二种方式包括:从数据库中查询与目标数目个标识特征匹配的标识数据,将查询到的标识数据确定为正样本标识数据。

其中,目标数目为任意的数目。由于条件信息包括多个标识特征,为了保证获取到的正样本标识数据的准确性,在查询数据库中的多个标识的标识数据时,仅将数据库中与目标数目个标识特征相匹配的标识数据作为正样本标识数据,以保证后续训练标识筛选模型的准确性。

基于上述两种方式,在一些实施例中,该样本标识数据还包括不满足条件信息的负样本标识数据;则该303还包括:从数据库中除正样本标识数据之外的标识数据中,选取至少一个标识数据,将选取的至少一个标识数据,确定为负样本标识数据。

其中,该数据库中包括至少一个标识及该至少一个标识对应的标识数据。从该数据库中获取到正样本标识数据之后,数据库中除正样本标识数据之外的标识数据对应的标识均为不满足条件信息的标识,则从数据库中除正样本标识数据之外的标识数据中选取至少一个标识数据作为训练标识筛选模型的负样本标识数据,以提高标识筛选模型的准确性。

例如,选取的负样本标识数据的数量与正样本标识数据的数量之间的差值小于第一阈值。其中,第一阈值为任意的数值。

再例如,在选取负样本标识数据之后,正样本标识数据在样本标识数据中的数量占比不小于占比阈值。其中,占比阈值为任意的数值。通过调整样本标识数据中包括的正样本标识数据的数量与负样本标识数据的数量,使得正样本标识数据的数量与负样本标识数据的数量趋于平衡,以便后续能够训练处准确的标识筛选模型。

304、服务器根据样本标识数据对标识筛选模型进行训练。

其中,训练后的标识筛选模型用于筛选满足条件信息的标识。由于样本标识数据中包括了对应的标识满足条件信息的正样本标识数据,则通过该样本标识数据对标识筛选模型进行训练,以使训练后的标识筛选模型能够为数据提供方筛选满足条件信息的标识。

在一些实施例中,该304包括:对样本标识数据中的多个维度的标识数据进行特征提取,得到样本标识数据对应的特征信息,对特征信息中的多个维度的特征进行加权融合,得到样本标识数据的融合特征,根据样本标识数据的融合特征,对标识筛选模型进行训练。

其中,样本标识数据包括多个维度的标识数据,特征信息中包括多个维度的特征,对于任一样本标识数据及对应的特征信息,该样本标识数据中包括的多个维度与该特征信息中包括的多个特征维度一一对应。在对样本标识数据中的多个维度的标识数据进行特征提取,得到每个维度的特征,该多个维度的特征构成该样本标识的特征信息。多个维度的权重是由开发人员任意设置的,例如,多个维度包括性别维度、年龄维度、喜好维度等,数据提供方为化妆品商家,该数据提供方提供的多媒体数据为化妆品广告,对于该数据提供方,女性爱关注化妆品广告,性别维度是多个维度中重要的维度,则设置多个维度的权重时,则将性别维度的权重设置为较大的权重,将年龄维度的权重、喜好维度的权重设置为较小的权重。

通过对样本标识数据的特征信息中多个维度的特征进行加权处理,以增强多个维度中重要维度的特征,以信息增益的方式来对特征进行有效的选择,提高了样本标识数据的融合特征的准确性,之后基于样本标识数据的融合特征来训练标识筛选模型,提高了训练后的标识筛选模型的准确性。

在一些实施例中,该304包括:响应于正样本标识数据的数量不小于数量阈值,根据样本标识数据,对标识筛选模型进行训练。

其中,数量阈值为任意的数值。在正样本标识数据的数量不小于数量阈值的情况下,根据样本标识数据对标识筛选模型进行训练,避免了由于正样本标识数据的数量过少而导致标识筛选模型的准确率低的问题,提高了训练的标识筛选模型的准确性。

在上述实施例的一种可能实现方式中,该方法还包括:服务器响应于正样本标识数据的数量小于数量阈值,向登录数据提供方的标识的目标设备发送条件信息更新请求,目标设备根据条件信息更新请求,对条件信息进行更新,返回更新后的条件信息,服务器接收目标设备返回的更新后的条件信息,基于更新后的条件信息重新获取样本标识数据。

在服务器确定正样本标识数据的数量小于数量阈值,表示基于当前的样本标识数据无法训练标识筛选模型,因此向目标设备发送条件信息更新请求,以使目标设备更新该条件信息,计算机在接收到目标设备返回的条件信息后,重新获取样本标识数据,在重新获取的样本标识数据中的正样本标识数据量满足数量阈值的情况下,基于重新获取到的样本标识数据对标识筛选模型进行训练。在获取到的正样本标识数据的数量小于数量阈值的情况下,本端设备通过与数据提供方对应的目标设备之间进行交互,以使数据提供方来更新条件信息,以使本端设备能够获取到足够多的正样本标识数据,以保证后续标识筛选模型的训练效果。

例如,目标设备更新条件信息的过程包括:目标设备用于根据条件信息更新请求,在条件信息中添加多个标识,得到更新后的条件信息;或者,目标设备用于根据条件信息更新请求,在条件信息中添加多个标识特征,得到更新后的条件信息。

其中,目标设备在条件信息中添加的多个标识为数据提供方确定的标识,添加的标识与更新条件信息之前包括的标识不同。目标设备在条件信息中添加的多个标识特征为数据提供方确定的标识特征,添加的标识特征与更新条件信息之前包括的标识特征不同。通过在条件信息中添加多个标识,或者添加多个标识特征,以便后续服务器基于更新后的条件信息,能够获取到更多的正样本标识数据,以使获取到的正样本标识数据的数量不小于数量阈值,从而能够根据重新获取到的样本标识数据对标识筛选模型进行训练。目标设备能够采取多种方式来更新条件信息,以便后续本端设备能够基于更新后的条件信息来获取到足够多的正样本标识数据,以保证后续标识筛选模型的训练效果。

在一些实施例中,样本标识数据包括满足条件信息的正样本标识数据,及不满足条件信息的负样本标识数据;则该304包括:响应于正样本标识数据在样本标识数据中的数量占比不小于占比阈值,根据正样本标识数据及负样本标识数据,对标识筛选模型进行训练。

其中,占比阈值为任意的数值。仅在正样本标识数据对应的数量占比不小于占比阈值的情况下,基于样本标识数据对标识筛选模型进行训练,使得样本标识数据中正样本标识数据的数量与负样本标识数据的数量趋于平衡,避免了由于正样本标识数据的在样本标识数据中的数量占比过少而导致标识筛选模型的准确率低的问题,从而保证了训练的标识筛选模型的准确性。

在上述实施例的一种可能实现方式中,训练标识筛选模型的过程包括:获取正样本标识数据的样本类型标签及负样本标识数据的样本类型标签,基于标识筛选模型,分别对正样本标识数据及负样本标识数据进行处理,得到正样本标识数据的预测类型及负样本标识数据的预测类型,根据正样本标识数据的预测类型与对应的样本类型标签之间的差异,及负样本标识数据的预测类型与对应的样本类型标签之间的差异,对标识筛选模型进行训练。

其中,样本类型标签用于指示对应的样本标识数据所属的样本类型,例如,正样本标识数据的样本类型标签为1,负样本标识数据的样本类型标签为0。

通过确定每个样本标识数据的样本类型标签,根据标识筛选模型为每个样本标识数据预测的预测类型与对应的样本类型标签之间的差异对标识筛选模型进行训练,以提高标识筛选模型的准确性。

例如,对标识筛选模型训练的过程包括:根据正样本标识数据的预测推荐概率与对应的样本推荐概率之间的差异,确定第一损失值,根据负样本标识数据的预测推荐概率与对应的样本推荐概率之间的差异,确定第二损失值,根据第一损失值及第二损失值,对标识筛选模型进行训练。

在一些实施例中,该304包括:根据样本标识数据对标识筛选模型进行迭代训练,响应于标识筛选模型的准确率大于准确率阈值,停止对标识筛选模型进行训练。

其中,准确率阈值为任意设置的阈值。在对标识筛选模型进行迭代训练的过程中,标识筛选模型的准确率大于准确率阈值时,表示当前的标识筛选模型满足要求,则不再对该标识筛选模型进行训练。通过设置准确率阈值,以保证训练得到的标识筛选模型的准确率足够高,以使训练后的标识筛选模型能够筛选出满足条件信息的标识。

在上述实施例到的一种可能实现方式中,样本标识数据包括正样本标识数据及负样本标识数据,则确定标识筛选模型的准确率的过程包括:基于该标识筛选模型,对多个样本标识数据进行处理,得到每个样本标识数据的预测推荐概率,根据多个样本标识数据的推荐概率,确定每个样本标识数据所属的预测类别,根据多个样本标识数据的预测类别及多个样本标识数据所属的样本类别,确定该标识筛选模型的准确率。

其中,样本类别包括正样本类别和负样本类别,预测类别包括预测正样本类别和预测负样本类别,预测正样本类别表示预测样本标识数据为正样本标识数据,预测负样本类别表示预测样本标识数据为负样本标识数据。

例如,根据多个样本标识数据的预测类别及多个样本标识数据的样本类别,确定第一数量、第二数量、第三数量及第四数量,第一数量指示预测类别为预测正样本类别的样本标识数据中的准确个数,第二数量指示预测类别为预测正样本类别的样本标识数据中的错误个数,第三数量指示预测类别为预测负样本类别的样本标识数据中的准确个数,第四数量指示预测类别为预测负样本类别的样本标识数据中的错误个数,确定第一数量与第四数量的第一和值,及第二数量与第三数量的第二和值,将第一数量与第一和值之间的比值确定为第一概率,将第二数量与第二和值之间的比值确定为第二概率,根据第一概率和第二概率,确定该标识筛选模型的准确率。

在一些实施例中,在304之后,该方法还包括:将训练后的标识筛选模型与数据提供方的标识对应存储。

在对标识筛选模型训练完成后,通过将训练后的标识筛选模型与数据提供方的标识对应存储,以便后续能够根据数据提供方的标识,来确定属于该数据提供方的标识筛选模型。

需要说明的是,本公开实施例仅是根据数据提供方提供的条件信息,来获取样本标识数据的,而在另一实施例中,配置文件包括条件信息及其他样本标识数据,该其他样本标识数据是由数据提供方提供的。在一些实施例中,其他标识数据包括与条件信息匹配的正样本标识数据,或者,包括与条件信息不匹配的负样本标识数据,或者,包括正样本标识数据及负样本标识数据。

服务器对配置文件进行解析,得到条件信息及其他样本标识数据,基于条件信息查询该服务器对应的数据库,得到该服务器对应的数据库中与条件信息匹配的样本标识数据,之后基于从该服务器对应的数据库中查询到的样本标识数据,并结合数据提供方提供的其他样本标识数据,为该数据提供方训练标识筛选模型,实现了一种联合多方数据训练模型的方式。并且,通过联合多方数据来训练标识筛选模型,丰富了训练标识筛选模型所用的样本标识数据,保证样本标识数据的多样性,从而提高了标识筛选模型的准确性。

305、服务器获取数据提供方提供的多媒体数据。

其中,多媒体数据为视频、文本、图像等。例如,该数据提供方为广告主,则该多媒体数据为广告主提供的广告。服务器获取数据提供方提供的多媒体数据,以便后续基于该数据提供方对应的标识筛选模型,对多媒体数据进行推荐。

在一些实施例中,该305包括:接收目标设备发送的多媒体数据。

其中,目标设备为登录数据提供方的标识的设备。在数据提供方需要服务器为自己推荐多媒体数据时,通过目标设备,向服务器发送多媒体数据,服务器接收该多媒体数据。

在一些实施例中,该305包括:从多媒体数据库中查询数据提供方提供的多媒体数据。

其中,多媒体数据库用于存储待推荐的多媒体数据及对应的数据提供方的标识。该多媒体数据库中包括多个数据提供方的多媒体数据,在为任一数据提供方进行多媒体数据推荐时,能够根据数据提供方的标识从该多媒体数据库中查询到该数据提供方提供的多媒体数据。

在上述实施例的一种可能实现方式中,该多媒体数据库存储于该服务器本地,则该服务器在获取到数据提供方的标识后,查询本地的多媒体数据库,得到该数据提供方的标识对应的多媒体数据。

例如,在多媒体数据库中存储多媒体数据的过程包括:管理人员基于该服务器,将数据提供方的标识及多媒体数据上传至该多媒体数据库中,将数据提供方提供的多媒体数据与数据提供方提供的标识对应存储。

在上述实施例的一种可能实现方式中,该多媒体数据库存储于数据服务器中,则获取多媒体数据的过程包括:服务器向数据服务器发送数据获取请求,该数据获取请求携带该数据提供方的标识,数据服务器接收到该数据获取请求后,从该数据服务器的多媒体数据库中,查询该数据提供方的标识对应的多媒体数据,向该服务器发送查询到的多媒体数据,该服务器接收该多媒体数据。

例如,在多媒体数据库中存储多媒体数据的过程包括:该数据服务器的管理人员基于该数据服务器,将数据提供方的标识及多媒体数据上传至该多媒体数据库中,将数据提供方的标识与多媒体数据对应存储。

306、服务器基于训练后的标识筛选模型,对多个标识的标识数据进行处理,得到每个标识的推荐概率。

其中,多个标识为在当前时刻之前的目标时长内登录的标识,该目标时长为任意时长。推荐概率用于指示标识筛选模型筛选的标识满足条件信息的可能性,推荐概率越大,表示标识满足条件信息的可能性越大,推荐概率越小,表示标识满足条件信息的可能性越小。通过选取当前时刻之前的目标时长内登录的多个标识,以保证后续将多媒体数据推荐后,被推荐的标识能够查看多媒体数据,保证多媒体数据的推荐效果,且确定每个标识的推荐概率,以便后续根据推荐概率对多媒体数据进行推荐。

在一些实施例中,在306之前,选取标识的过程包括:根据数据库中包括的多个标识的标识数据,从多个标识中选取在当前时刻之前的目标时长内登录的多个标识。

在本公开实施例中,数据库中的标识数据包括对应的标识的登录时间,根据多个标识的标识数据,能够从中选取在当前时刻之前登录的目标时长内登录的多个标识。

在上述实施例的一种可能实现方式中,标识数据中包括操作记录,则在任一标识登录该服务器时,为标识生成一条登录操作记录,该登录操作记录中包括登录时间,将该登录操作记录存储于该标识的标识数据中。

307、服务器根据每个标识的推荐概率,从多个标识中选取目标标识。

由于每个推荐概率用于指示标识筛选模型筛选的标识满足条件信息的可能性,则通过多个标识的推荐概率,从中选取满足条件信息的目标标识,以便后续将多媒体数据推荐给目标标识。

在一些实施例中,该307包括以下两种方式。

第一种方式:从多个标识中选取目标数量的目标标识,目标标识的推荐概率大于多个标识中其他标识的推荐概率。

其中,目标数量为任意的数量。在确定多个标识的推荐概率后,从多个标识中选取概率最大的目标数量的标识作为目标标识,以保证选取的目标标识的推荐概率大,从而保证后续多媒体数据的推荐效果。

第二种方式:从多个标识数据中选取推荐概率大于目标概率的目标标识。

其中,目标概率为任意的概率。

308、服务器将多媒体数据推荐给目标标识。

通过选取在当前时刻之前的目标时长内登录的标识,并根据标识的推荐概率来推荐多媒体数据,以保证被推荐的目标标识为满足条件信息的标识,且目标标识为活跃标识,以增强目标标识查看推荐的多媒体数据的可能性,保证了多媒体数据的推荐效果。

需要说明的是,本公开实施例是根据确定的多个标识的推荐概率,来对多媒体数据进行推荐的,而在另一实施例中,无需执行步骤305-308,能够采取其他方式,基于训练后的标识筛选模型,对数据提供方提供的多媒体数据进行推荐。

在一些实施例中,在308之后,该方法还包括以下309-311:

309、服务器根据多个目标标识的操作记录,确定多个目标标识中对多媒体数据执行目标操作的标识的数量。

其中,目标操作为任意的操作,例如,目标操作为点击操作或下载操作等。

310、服务器将数量与多个目标标识的数量之间的比值,确定为转化率。

311、响应于转化率小于转化率阈值,对训练后的标识筛选模型进行重新训练。

其中,转化率阈值为任意设置的数值。如果转化率不小于转化率阈值,表示多媒体数据的推荐效果满足要求,如果转化率小于转化率阈值,表示多媒体数据的推荐效果满足要求,需要重新对标识筛选模型进行训练,以便后续能够基于重新训练后的标识筛选模型对多媒体数据进行推荐,以提升多媒体数据的推荐效果。

在一些实施例中,该311包括:响应于转化率小于转化率阈值,增大标识筛选模型的准确率阈值,基于增大后的准确率阈值,对训练后的标识筛选模型进行重新训练,以使重新训练后的标识筛选模型的准确率大于增大后的准确率阈值。

基于增大标识筛选模型的准确率阈值,对训练后的标识筛选模型进行重新训练,以提高重新训练后的标识筛选模型的准确率,以使后续能够提升多媒体数据的推荐效果。

本公开实施例提供的数据推荐方法,在获取到数据提供方提供的条件信息后,结合该条件信息来获取样本标识数据,为该数据提供方训练一个标识筛选模型,实现了标识筛选模型的个性化训练,保证了标识筛选模型与该数据提供方提供的条件信息相匹配,使得标识筛选模型能够筛选出满足该条件信息的标识。之后即可基于训练后的标识筛选模型将该数据提供方提供的多媒体数据推荐给满足数据提供方要求的标识,提高了数据推荐的准确性,保证了数据推荐效果。

并且,本端设备通过与数据提供方对应的目标设备之间进行交互,来获取数据提供方提供的条件信息,之后结合本端设备对应的数据库来获取训练标识筛选模型的样本标识数据,之后基于获取到的样本标识数据为该数据提供方训练标识筛选模型,实现了一种基于一方数据来训练模型的方案。

并且,本公开实施例提供了一种数据管理平台,该数据管理平台提供为数据提供方提供了一种应用,基于该应用,能够实现数据提供方与数据管理平台之间的快速对接,并基于数据管理平台中的数据库,来快速获取样本标识数据,为训练标识筛选模型提供数据支持。

并且,通过本公开提供的标识筛选模型,为数据提供方筛选出目标标识,挖掘出来与数据提供方匹配的人群链路,并将数据提供方提供的多媒体数据推荐给筛选出的标识,以保证多媒体数据的推荐效果。

并且,本公开实施例提供的数据推荐方法,提供了多种选取标识的方式,选取推荐概率较大的标识作为多媒体数据的推荐对象,使得选取的标识满足数据提供方提供的条件信息,保证了后续多媒体数据的推荐效果。

图4是根据一示例性实施例示出的一种基于一方人群数据联合训练模型的流程,该流程包括:

1、在为数据提供方训练标识筛选模型之前,数据提供方需要确定数据提供方的优化目标、数据内容和数据格式,以便数据提供方能够直接与平台方进行数据对接,并由数据提供方提供用于训练标识筛选模型的条件信息,该条件信息中包括多个标识或标识特征,该多个标识是由该数据提供方确定的,该标识特征是由该数据提供方提供的,或者,该标识特征是由数据提供方从服务器提供的多种标识特征中选取的。

在本公开实施例中,数据提供方作为请求训练标识筛选模型的一方,服务器作为提供模型训练服务的服务器,在数据提供方提供条件信息后,服务器能够为该数据提供方训练一个标识筛选模型,并在训练之后,基于训练后的标识筛选服务器对该数据提供方提供的多媒体数据进行推荐。

2、登录该数据提供方的目标设备,通过该数据管理平台,将条件信息提供给服务器,服务器接收该数据提供方发送的条件信息,根据该条件信息,从数据库中获取样本标识数据,并在对获取到的正样本标识数据的数量进行检测,如果正样本标识数据的数量不小于数量阈值,则执行步骤3,如果正样本标识数据的数量小于数量阈值,则向目标设备发送条件信息更新请求,目标设备根据该条件信息更新请求,更新该条件信息,以使服务器能够根据更新后的条件信息获取到的正样本标识数据的数量超过数量阈值。

3、服务器在获取到样本标识数据后,对样本标识数据进行特征提取,得到每个样本标识数据的特征信息,该特征信息包括多个维度的特征,对每个特征信息中的多个维度的特征进行加权融合,得到每个样本标识数据的融合特征。

4、服务器根据多个样本标识数据的融合特征,对标识筛选模型进行训练,在训练完成后,将训练后的标识筛选模型与该数据提供方的标识对应存储。服务器从数据库中选取在当前时刻之前的目标时长内登录的标识,服务器基于训练后的标识筛选模型,对选取的标识进行处理,得到每个标识的推荐概率,根据选取的多个标识的推荐概率,选取多个目标标识,将该数据提供方提供的多媒体数据推荐给多个目标标识。

5、在对多媒体数据推荐后,服务器根据该多个目标标识的标识数据中的操作记录进行离线统计,确定该标识筛选模型的转化率,如果转化率满足要求,由数据提供方对标识筛选模型进行测试,以确定该多媒体数据的推荐效果,如果推荐效果满意,则服务器后续基于该标识筛选模型,对该数据提供方提供的多媒体数据进行推荐。如果推荐效果不满意,即标识筛选模型的准化率小于转化率阈值,则按照上述模型训练的过程,重新训练标识筛选模型,直至数据提供方满意。

图5是根据一示例性实施例示出的一种数据推荐装置的框图。参见图5,该数据推荐装置包括:

获取单元501,被配置为执行获取数据提供方提供的条件信息,条件信息表示允许向满足条件信息的标识推荐数据提供方提供的多媒体数据;

获取单元501,被配置为执行获取样本标识数据,样本标识数据至少包括满足条件信息的正样本标识数据;

训练单元502,被配置为执行根据样本标识数据对标识筛选模型进行训练,训练后的标识筛选模型用于筛选满足条件信息的标识;

推荐单元503,被配置为执行基于训练后的标识筛选模型,对数据提供方提供的多媒体数据进行推荐。

在一些实施例中,条件信息包括多个标识;如图6所示,获取单元501,包括:

确定子单元5011,被配置为执行从数据库中查询多个标识对应的标识数据,将查询到的标识数据确定为正样本标识数据,数据库用于存储至少一个标识及至少一个标识的标识数据。

在一些实施例中,条件信息包括的多个标识为数据提供方确定的第一标识,数据库用于存储本端服务器注册的至少一个第二标识及至少一个第二标识对应的标识数据;确定子单元5011,被配置为执行对于任一第一标识,从数据库中查询包含第一标识的标识数据,将查询到的标识数据确定为正样本标识数据。

在一些实施例中,条件信息包括标识特征;如图6所示,获取单元501,包括:

确定子单元5011,被配置为执行从数据库中查询与标识特征匹配的标识数据,将查询到的标识数据确定为正样本标识数据,数据库用于存储至少一个标识及至少一个标识的标识数据。

在一些实施例中,样本标识数据还包括不满足条件信息的负样本标识数据;如图6所示,获取单元501,还包括:

第一选取子单元5012,被配置为执行从数据库中除正样本标识数据之外的标识数据中,选取至少一个标识数据;

确定子单元5011,被配置为执行将选取的至少一个标识数据,确定为负样本标识数据。

在一些实施例中,如图6所示,训练单元502,包括:

训练子单元5021,被配置为执行响应于正样本标识数据在样本标识数据中的数量占比不小于占比阈值,根据正样本标识数据及负样本标识数据,对标识筛选模型进行训练。

在一些实施例中,样本标识数据包括多个维度的标识数据;训练单元502,包括:

特征提取子单元5022,被配置为执行对样本标识数据中的多个维度的标识数据进行特征提取,得到样本标识数据对应的特征信息,特征信息中包括多个维度的特征;

加权融合子单元5023,被配置为执行对特征信息中的多个维度的特征进行加权融合,得到样本标识数据的融合特征;

训练子单元5021,被配置为执行根据样本标识数据的融合特征,对标识筛选模型进行训练。

在一些实施例中,如图6所示,训练单元502,包括:

训练子单元5021,被配置为执行响应于正样本标识数据的数量不小于数量阈值,根据样本标识数据,对标识筛选模型进行训练。

在一些实施例中,如图6所示,数据推荐装置还包括:

发送单元504,被配置为执行响应于正样本标识数据的数量小于数量阈值,向登录数据提供方的标识的目标设备发送条件信息更新请求,目标设备用于根据条件信息更新请求,对条件信息进行更新,返回更新后的条件信息;

接收单元505,被配置为执行接收目标设备返回的更新后的条件信息,基于更新后的条件信息重新获取样本标识数据。

在一些实施例中,

目标设备用于根据条件信息更新请求,在条件信息中添加多个标识,得到更新后的条件信息;或者,

目标设备用于根据条件信息更新请求,在条件信息中添加多个标识特征,得到更新后的条件信息。

在一些实施例中,如图6所示,获取单元501,包括:

接收子单元5013,被配置为执行接收登录数据提供方的标识的目标设备发送的配置文件;

解析子单元5014,被配置为执行对配置文件进行解析,得到条件信息。

在一些实施例中,如图6所示,获取单元501,包括:

查询子单元5015,被配置为执行从文件数据库中查询数据提供方的标识对应的配置文件,文件数据库用于存储至少一个数据提供方的标识及对应的配置文件;

解析子单元5014,被配置为执行对查询到的配置文件进行解析,得到条件信息。

在一些实施例中,如图6所示,训练单元502,包括:

训练子单元5021,被配置为执行根据样本标识数据对标识筛选模型进行迭代训练;

训练子单元5021,被配置为执行响应于标识筛选模型的准确率大于准确率阈值,停止对标识筛选模型进行训练。

在一些实施例中,如图6所示,数据推荐装置还包括:

存储单元506,被配置为执行将训练后的标识筛选模型与数据提供方的标识对应存储。

在一些实施例中,如图6所示,推荐单元503,包括:

获取子单元5031,被配置为执行获取数据提供方提供的多媒体数据;

处理子单元5032,被配置为执行基于训练后的标识筛选模型,对多个标识的标识数据进行处理,得到每个标识的推荐概率,多个标识为在当前时刻之前的目标时长内登录的标识;

第二选取子单元5033,被配置为执行根据每个标识的推荐概率,从多个标识中选取目标标识;

推荐子单元5034,被配置为执行将多媒体数据推荐给目标标识。

在一些实施例中,第二选取子单元5033,被配置为执行从多个标识中选取目标数量的目标标识,目标标识的推荐概率大于多个标识中其他标识的推荐概率;或者,从多个标识数据中选取推荐概率大于目标概率的目标标识。

在一些实施例中,如图6所示,装置还包括:

选取单元507,被配置为执行根据数据库中包括的多个标识的标识数据,从多个标识中选取在当前时刻之前的目标时长内登录的多个标识。

在一些实施例中,目标标识包括多个;如图6所示,数据推荐装置还包括:

确定单元508,被配置为执行根据多个目标标识的操作记录,确定多个目标标识中对多媒体数据执行目标操作的标识的数量;

确定单元508,被配置为执行将数量与多个目标标识的数量之间的比值,确定为转化率;

训练单元502,被配置为执行响应于转化率小于转化率阈值,对训练后的标识筛选模型进行重新训练。

在一些实施例中,训练单元502,被配置为执行响应于转化率小于转化率阈值,增大标识筛选模型的准确率阈值;基于增大后的准确率阈值,对训练后的标识筛选模型进行重新训练,以使重新训练后的标识筛选模型的准确率大于增大后的准确率阈值。

在一些实施例中,获取子单元5031,被配置为执行接收目标设备发送的多媒体数据,目标设备为登录数据提供方的标识的设备。

在一些实施例中,获取子单元5031,被配置为执行从多媒体数据库中查询数据提供方提供的多媒体数据,多媒体数据库用于存储待推荐的多媒体数据及对应的数据提供方的标识。

关于上述实施例中的装置,其中各个单元执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。

在示例性实施例中,还提供了一种服务器,服务器包括:

一个或多个处理器;

用于存储一个或多个处理器可执行指令的易失性或非易失性存储器;

其中,一个或多个处理器被配置为执行上述数据推荐方法中服务器所执行的步骤。

图7是根据一示例性实施例示出的一种服务器的结构示意图,该服务器700可因配置或性能不同而产生比较大的差异,可以包括一个或一个以上处理器(centralprocessingunits,cpu)701和一个或一个以上的存储器702,其中,存储器702中存储有至少一条程序代码,该至少一条程序代码由处理器701加载并执行以实现上述各个方法实施例提供的方法。当然,该服务器还可以具有有线或无线网络接口、键盘以及输入输出接口等部件,以便进行输入输出,该服务器还可以包括其他用于实现设备功能的部件,在此不做赘述。

在示例性实施例中,还提供了一种非临时性计算机可读存储介质,当存储介质中的程序代码由电子设备的处理器执行时,使得电子设备能够执行上述数据推荐方法中终端或服务器所执行的步骤。在一些实施例,存储介质可以是非临时性计算机可读存储介质,例如,所述非临时性计算机可读存储介质可以是rom、随机存取存储器(ram)、cd-rom、磁带、软盘和光数据存储设备等。

在示例性实施例中,还提供了一种计算机程序产品,包括计算机程序,计算机程序被处理器执行时实现上述主题标签生成方法。

本领域技术人员在考虑说明书及实践这里的公开后,将容易想到本公开的其它实施方案。本公开旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未公开的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的真正范围和精神由下面的权利要求指出。

应当理解的是,本公开并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本公开的范围仅由所附的权利要求来限制。


技术特征:

1.一种数据推荐方法,其特征在于,所述数据推荐方法包括:

获取数据提供方提供的条件信息,所述条件信息表示允许向满足所述条件信息的标识推荐所述数据提供方提供的多媒体数据;

获取样本标识数据,所述样本标识数据至少包括满足所述条件信息的正样本标识数据;

根据所述样本标识数据对标识筛选模型进行训练,训练后的标识筛选模型用于筛选满足所述条件信息的标识;

基于所述训练后的标识筛选模型,对所述数据提供方提供的多媒体数据进行推荐。

2.根据权利要求1所述的数据推荐方法,其特征在于,所述条件信息包括多个标识;所述获取样本标识数据,包括:

从数据库中查询所述多个标识对应的标识数据,将查询到的标识数据确定为所述正样本标识数据,所述数据库用于存储至少一个标识及所述至少一个标识的标识数据。

3.根据权利要求2所述的数据推荐方法,其特征在于,所述条件信息包括的多个标识为所述数据提供方确定的第一标识,所述数据库用于存储本端服务器注册的至少一个第二标识及所述至少一个第二标识对应的标识数据;所述从数据库中查询所述多个标识对应的标识数据,包括:

对于任一第一标识,从所述数据库中查询包含所述第一标识的标识数据,将查询到的标识数据确定为所述正样本标识数据。

4.根据权利要求1所述的数据推荐方法,其特征在于,所述条件信息包括标识特征;所述获取样本标识数据,包括:

从数据库中查询与所述标识特征匹配的标识数据,将查询到的标识数据确定为所述正样本标识数据,所述数据库用于存储至少一个标识及所述至少一个标识的标识数据。

5.根据权利要求2-4任一项所述的方法,其特征在于,所述样本标识数据还包括不满足所述条件信息的负样本标识数据;所述获取样本标识数据,还包括:

从所述数据库中除所述正样本标识数据之外的标识数据中,选取至少一个标识数据;

将选取的所述至少一个标识数据,确定为所述负样本标识数据。

6.根据权利要求5所述的方法,其特征在于,所述根据所述样本标识数据对标识筛选模型进行训练,包括:

响应于所述正样本标识数据在所述样本标识数据中的数量占比不小于占比阈值,根据所述正样本标识数据及所述负样本标识数据,对所述标识筛选模型进行训练。

7.一种数据推荐装置,其特征在于,所述数据推荐装置包括:

获取单元,被配置为执行获取数据提供方提供的条件信息,所述条件信息表示允许向满足所述条件信息的标识推荐所述数据提供方提供的多媒体数据;

所述获取单元,被配置为执行获取样本标识数据,所述样本标识数据至少包括满足所述条件信息的正样本标识数据;

训练单元,被配置为执行根据所述样本标识数据对标识筛选模型进行训练,训练后的标识筛选模型用于筛选满足所述条件信息的标识;

推荐单元,被配置为执行基于所述训练后的标识筛选模型,对所述数据提供方提供的多媒体数据进行推荐。

8.一种服务器,其特征在于,所述服务器包括:

一个或多个处理器;

用于存储所述一个或多个处理器可执行指令的易失性或非易失性存储器;

其中,所述一个或多个处理器被配置为执行如权利要求1至权利要求6任一项所述的数据推荐方法。

9.一种非临时性计算机可读存储介质,其特征在于,当所述存储介质中的指令由服务器的处理器执行时,使得所述服务器能够执行如权利要求1至权利要求6任一项所述的数据推荐方法。

10.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至权利要求6任一项所述的数据推荐方法。

技术总结
本公开是关于一种数据推荐方法、装置、服务器及存储介质,属于计算机技术领域。方法包括:获取数据提供方提供的条件信息,获取样本标识数据,根据样本标识数据对标识筛选模型进行训练,基于训练后的标识筛选模型,对数据提供方提供的多媒体数据进行推荐。本公开实施例提供的数据推荐方法,在获取到数据提供方提供的条件信息后,结合该条件信息来获取样本标识数据,为该数据提供方训练一个标识筛选模型,实现了标识筛选模型的个性化训练,使得标识筛选模型能够筛选出满足该条件信息的标识。之后即可基于训练后的标识筛选模型将该数据提供方提供的多媒体数据推荐给满足数据提供方要求的标识,提高了数据推荐的准确性,保证了数据推荐效果。

技术研发人员:何攀;高小平;郑秋野;王宗;王建明;韩旭;尹立岩;陈润
受保护的技术使用者:北京达佳互联信息技术有限公司
技术研发日:2021.04.21
技术公布日:2021.08.03

转载请注明原文地址:https://doc.8miu.com/read-8875.html

最新回复(0)