本申请涉及计算机,具体而言,涉及一种跨平台数据关联方法、装置、电子设备及计算机存储介质。
背景技术:
1、在日益复杂的数字环境中,品牌商在面对由不同开发商所开发的多种web网站、应用程序(app)和小程序时,存在着一些实际的需求来关联在不同软件(或平台)的用户行为,例如用户在平台a浏览广告后于平台b完成购买行为,或是在平台c阅读某篇文章后于平台d发生交易行为,这种关联对于品牌评估市场推广效能至关重要,市场需求显著。
2、传统的方法依赖于精准的用户标识符进行跨平台用户行为的关联分析,诸如身份证号码、手机号码等具备唯一性辨识功能的信息。然而,随着隐私保护相关法律法规的完善,及各平台对用户隐私数据的强管控,品牌商越来越难以从平台方获取到这些用户隐私字段,从而导致基于精确id匹配的传统关联分析难以实施。
3、针对相关技术中存在的上述问题,目前尚未发现有效的解决方案。
技术实现思路
1、本申请提供了一种跨平台数据关联方法、装置、电子设备及计算机存储介质,以解决相关技术中存在的上述技术问题。
2、根据本申请的一个实施例,提供了一种跨平台数据关联方法,包括:采集多个用户账号在多个平台上产生的多个用户行为数据;对所述多个用户行为数据进行跨平台行为匹配,生成行为数据对集合,以及每条行为数据对的关联概率值,其中,所述行为数据对集合包括多条行为数据对,每条行为数据对包括第一行为数据和第二行为数据,所述第一行为数据和所述第二行为数据分别对应不同平台,所述关联概率值用于表征同一个行为数据对中的第一行为数据和第二行为数据属于同一个用户账号的概率;根据所述关联概率值确定所述行为数据对集合中第一行为数据和第二行为数据属于同一个用户账号的若干个行为数据对。
3、根据本申请的另一个实施例,提供了一种跨平台数据匹配装置,包括:采集模块,用于采集多个用户账号在多个平台上产生的多个用户行为数据;匹配模块,用于对所述多个用户行为数据进行跨平台行为匹配,生成行为数据对集合,以及每条行为数据对的关联概率值,其中,所述行为数据对集合包括多条行为数据对,每条行为数据对包括第一行为数据和第二行为数据,所述第一行为数据和所述第二行为数据分别对应不同平台,所述关联概率值用于表征同一个行为数据对中的第一行为数据和第二行为数据属于同一个用户账号的概率;确定模块,用于根据所述关联概率值确定所述行为数据对集合中第一行为数据和第二行为数据属于同一个用户账号的若干个行为数据对。
4、可选地,所述匹配模块包括提取单元,用于提取每个用户行为数据的多个特征字段;数据处理单元,用于对所述多个特征字段的特征值分别进行标准化处理,得到所述多个特征字段对应的多个中间特征;匹配单元,用于确定每个中间特征对应的权重,将所述中间特征和所述权重输入预构建的匹配模型,采用所述匹配模型对跨平台的用户行为数据进行特征相似度匹配,生成行为数据对集合,以及每条行为数据对的关联概率值。
5、可选地,所述数据处理单元包括提取子单元,用于针对每个特征字段,提取所述特征字段的多个特征值,其中,所述多个特征值中的每个特征值分别来自一个用户行为数据,每个用户行为数据对应一个平台;转换单元,用于采用预设标准格式将多个特征值转换为统一格式的中间特征。
6、可选地,所述跨平台数据关联装置还包括第一获取模块,用于获取正样本和负样本,其中,所述正样本为关联概率值大于或等于预设阈值的行为数据对,所述负样本为关联概率值小于所述预设阈值的行为数据对;训练模块,用于采用所述正样本和所述负样本对初始模型进行训练,得到预构建的匹配模型。
7、可选地,所述训练模块还包括获取子单元,用于获取所述初始模型中的各超参数对应的取值区间;列举单元,用于列举所述取值区间内多个超参数组合;验证单元,用于针对所述多个超参数组合中的每个超参数组合,将所述正样本和所述负样本输入所述初始模型中进行验证,得到多个验证分值;选择单元,用于选择验证分值最高的目标超参数组合,将所述初始模型的超参数设置为所述目标超参数组合的值,作为预构建的匹配模型。
8、可选地,跨平台数据关联装置还包括第一识别模块,用于识别所述交易行为对应的第一时间戳,以及所述浏览行为对应的第二时间戳,其中,所述行为数据对中的所述第一行为数据为交易行为,所述第二行为数据为浏览行为;分析模块,用于根据所述第一时间戳和所述第二时间戳,分析所述交易行为和所述浏览行为的先后顺序;第一调整模块,用于若所述交易行为在所述浏览行为之后,则增大所述行为数据对的关联概率值。
9、可选地,跨平台数据关联装置还包括第二识别模块,用于识别所述浏览行为的浏览方式和/或对浏览内容的操作类型,其中,所述行为数据对中的所述第一行为数据为交易行为,所述第二行为数据为浏览行为;第二调整模块,用于基于所述浏览方式与交易行为的关联强度值调整所述关联概率值,和/或,基于所述操作类型与交易行为的关联强度值调整所述关联概率值。
10、根据本申请的又一个实施例,还提供了一种计算机存储介质,所述计算机存储介质中存储有计算机程序,其中,所述计算机程序被设置为运行时执行上述任一项装置实施例中的步骤。
11、根据本申请的又一个实施例,还提供了一种电子装置,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;其中:存储器,用于存放计算机程序;处理器,用于通过运行存储器上所存放的程序来执行上述方法中的步骤。
12、根据本申请的又一个实施例,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述方法中的步骤。
13、通过本申请实施例,采集多个用户账号在多个平台上产生的多个用户行为数据;对多个用户行为数据进行跨平台行为匹配,生成行为数据对集合,以及每条行为数据对的关联概率值,其中,行为数据对集合包括多条行为数据对,每条行为数据对包括第一行为数据和第二行为数据,第一行为数据和第二行为数据分别对应不同平台,关联概率值用于表征同一个行为数据对中的第一行为数据和第二行为数据属于同一个用户账号的概率;根据关联概率值确定行为数据对集合中第一行为数据和第二行为数据属于同一个用户账号的若干个行为数据对,在无法获取或无法使用精准的用户标识符,来关联跨平台的用户行为的情况下,采用行为数据替代精准的用户标识符,实现跨平台的用户行为关联,克服了传统依赖单一精准标识符进行用户匹配的局限性。
1.一种跨平台数据关联方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,对所述多个用户行为数据进行跨平台行为匹配,生成行为数据对集合,以及每条行为数据对的关联概率值包括:
3.根据权利要求2所述的方法,其特征在于,对所述多个特征字段的特征值分别进行标准化处理,得到所述多个特征字段对应的多个中间特征,包括:
4.根据权利要求2所述的方法,其特征在于,在将所述中间特征和所述权重输入预构建的匹配模型之前,所述方法还包括:
5.根据权利要求4所述的方法,其特征在于,采用所述正样本和所述负样本对初始模型进行训练,得到预构建的匹配模型包括:
6.根据权利要求1所述的方法,其特征在于,所述行为数据对中的所述第一行为数据为交易行为,所述第二行为数据为浏览行为,在生成行为数据对集合,以及每条行为数据对的关联概率值之后,所述方法还包括:
7.根据权利要求1所述的方法,其特征在于,所述行为数据对中的所述第一行为数据为交易行为,所述第二行为数据为浏览行为,在生成行为数据对集合,以及每条行为数据对的关联概率值之后,所述方法还包括:
8.一种跨平台数据关联装置,其特征在于,包括:
9.一种电子设备,其特征在于,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;其中:
10.一种计算机存储介质,其特征在于,所述计算机存储介质包括存储的程序,其中,所述程序运行时执行权利要求1至7中任一项所述的跨平台数据关联方法。
