本发明涉及交易数据异常监控,具体涉及一种基于5g技术的pos机数据智能化处理方法。
背景技术:
1、pos机作为处理销售交易的关键设备,pos机数据中记录的交易信息对于商家来说至关重要。随着5g技术的普及和发展,pos机迎来了新的发展机遇。5g技术不仅提高了数据传输的速度和稳定性,还增强了数据处理和分析的能力,使得pos机能够更有效地处理大量数据。由于pos机数据涉及交易金额、客户信息等敏感信息,一旦受到攻击或篡改,不仅可能导致商家损失,还可能影响客户的信任度。
2、现有技术利用pca(principal component analysis,主成分分析)算法对pos机的待分析交易数据进行异常检测,获取各个数据点的异常得分,从而分析出pos机的待分析交易数据中偏离正常模式的异常数据点。然而,现有技术利用pca算法对pos机的待分析交易数据进行异常检测时,在不同种类的预设交易指标的维度下交易数据点的数值大小具有较大的差异,导致协方差系数难以准确反映预设交易指标内在的重要性和相关性,导致pos机数据的异常检测结果不准确。
技术实现思路
1、为了解决现有技术利用pca算法对pos机的待分析交易数据进行异常检测时,在不同种类的预设交易指标的维度下交易数据点的数值大小具有较大的差异,导致协方差系数难以准确反映预设交易指标内在的重要性和相关性,导致pos机数据的异常检测结果不准确的技术问题,本发明的目的在于提供一种基于5g技术的pos机数据智能化处理方法,所采用的技术方案具体如下:
2、一种基于5g技术的pos机数据智能化处理方法,所述方法包括以下步骤:
3、获取待分析交易数据;所述待分析交易数据包含所有交易数据点;每个交易数据点对应所有预设交易指标的维度;
4、在待分析交易数据中,根据所有交易数据点在预设交易指标的维度下的主要特征分布状况,获取所述预设交易指标的集中分布特征值;根据所有交易数据点在预设交易指标的维度下的密度分布情况以及所述预设交易指标的所述集中分布特征值,获取所述预设交易指标的区分特征值;根据所有所述交易数据点在两种所述预设交易指标的维度的分布情况以及两种所述预设交易指标之间所述区分特征值的差异,获取两种所述预设交易指标的相关特征值;
5、获取两种预设交易指标的协方差系数;根据两种预设交易指标的所述区分特征值和所述相关特征值,对两种预设交易指标的协方差系数进行调整,获取两种预设交易指标的调整后的协方差系数;根据每两种预设交易指标的调整后的协方差系数,获取待分析交易数据的异常检测结果。
6、进一步地,所述集中分布特征值的获取方法包括:
7、在预设交易指标的维度下,将预设交易指标的数值大于预设第一分位数阈值且小于预设第二分位数阈值的所有交易数据点所在所述预设交易指标的区间,作为所述预设交易指标的主要特征区间;将所有交易数据点所在所述预设交易指标的区间,作为所述预设交易指标的参考特征区间;
8、计算主要特征区间的长度和参考特征区间的长度的比值,对比值进行负相关归一化,获取所述预设交易指标的所述集中分布特征值。
9、进一步地,所述集中分布特征值的获取方法包括:
10、根据集中分布特征值公式获得所述集中分布特征值,所述集中分布特征值公式包括:;其中,为第a种所述预设交易指标的所述集中分布特征值;为第a种所述预设交易指标的所述主要特征区间;为第a种所述预设交易指标的所述参考特征区间;为第a种所述预设交易指标的所述主要特征区间的长度;为第a种所述预设交易指标的所述参考特征区间的长度;为以e为底数的指数函数。
11、进一步地,所述区分特征值的获取方法包括:
12、在所述预设交易指标的所述参考特征区间中,将除了所述主要特征区间以外的区间,作为所述预设交易指标的剩余特征区间;
13、将主要特征区间和剩余特征区间均作为所述预设交易指标的待分析密度特征区间;获取所述待分析密度特征区间的密度最大值、密度最小值和均值密度;
14、根据所述待分析密度特征区间的密度最大值、密度最小值和均值密度,获取待分析密度特征区间的属性密度向量;
15、在预设交易指标的维度下,根据主要特征区间的所述属性密度向量与所述剩余特征区间的所述属性密度向量之间的差异,所述预设交易指标的所述集中分布特征值,主要特征区间的所述均值密度与所述剩余特征区间的所述均值密度之间的差异,获取所述预设交易指标的区分特征值。
16、进一步地,所述区分特征值的获取方法包括:
17、根据区分特征值公式获取所述区分特征值,所述区分特征值的获取公式包括:
18、;其中,为第a种所述预设交易指标的区分特征值;为第a种所述预设交易指标的所述集中分布特征值;为第a种所述预设交易指标的所述主要特征区间;为第a种所述预设交易指标的所述剩余特征区间;为主要特征区间的所述属性密度向量;为剩余特征区间的所述属性密度向量;为主要特征区间的所述均值密度;为剩余特征区间的所述均值密度;为向量的模;为绝对值符号;为归一化函数。
19、进一步地,所述属性密度向量的获取方法包括:
20、根据属性密度向量公式获取所述属性密度向量,所述属性密度向量的获取公式包括:
21、;其中,为待分析密度特征区间的所述属性密度向量;为第a种所述预设交易指标的待分析密度特征区间;为待分析密度特征区间的所述密度最大值;为待分析密度特征区间的所述密度最小值;为待分析密度特征区间的所述均值密度。
22、进一步地,所述相关特征值的获取方法包括:
23、在两种预设交易指标的维度下,将同时位于两种预设交易指标的所述主要特征区间的交易数据点,作为两种预设交易指标的主要重复数据点;将同时位于两种预设交易指标的所述剩余特征区间的交易数据点,作为两种预设交易指标的剩余重复数据点;
24、根据相关特征值公式获取所述相关特征值,所述相关特征值的获取公式包括:
25、;其中,为第m种所述预设交易指标和第n种所述预设交易指标的所述相关特征值;为第m种所述预设交易指标和第n种所述预设交易指标的主要重复数据点的数量;为第m种所述预设交易指标的所述主要特征区间;为主要特征区间的所有交易数据点的总数量;为第n种所述预设交易指标的所述主要特征区间;为主要特征区间的所有交易数据点的总数量;为第m种所述预设交易指标和第n种所述预设交易指标的所述剩余重复数据点的数量;为第m种所述预设交易指标的所述剩余特征区间;为所述剩余特征区间的所有交易数据点的总数量;为第n种所述预设交易指标的所述剩余特征区间;为剩余特征区间的所有交易数据点的总数量;为第m种所述预设交易指标的所述区分特征值;为第n种所述预设交易指标的所述区分特征值;为归一化函数。
26、进一步地,所述调整后的协方差系数的获取方法包括:
27、根据两种预设交易指标的所述区分特征值、两种预设交易指标的所述相关特征值和两种预设交易指标的协方差系数,获取两种预设交易指标的调整后的协方差系数;所述区分特征值、所述相关特征值、所协方差系数和调整后的协方差系数呈正相关性。
28、进一步地,所述获取两种预设交易指标的协方差系数的方法包括:
29、基于pca算法,获取两种预设交易指标的协方差系数。
30、进一步地,所述异常检测结果的获取方法包括:
31、基于pca算法,根据每两种预设交易指标的调整后的协方差系数,获取待分析交易数据中每个交易数据点的异常得分;根据每个交易数据点的异常得分,获取待分析交易数据的异常检测结果。
32、本发明具有如下有益效果:
33、本发明通过预设交易指标的重要性以及预设交易指标之间的相关性,进而对两种预设交易指标的协方差系数进行调整,确定能反映预设交易指标的内在重要性和相关性的协方差系数。为了分析预设交易指标的重要性,首先通过预设交易指标的集中分布特征值反映在预设交易指标的维度下主要数据分布集中情况。考虑到主要数据的密度与剩余数据的密度差异情况越相近,说明剩余数据越可能是特殊情况导致出现边缘数据,越不可能是异常数据产生的边缘数据,预设交易指标对异常数据越不具有较好的区分能力。考虑到预设交易指标的集中分布特征值越大,代表在预设交易指标的维度下主要数据分布越集中,说明预设交易指标对处于边缘的数据具有较好的区分能力,获取所述预设交易指标的区分特征值;区分特征值越大代表预设交易指标对交易数据点具有很好的区分效果,预设交易指标越重要。为了分析预设交易指标之间的相关性,考虑到两种预设交易指标的数据密度特征和分布特征差异越小,两种预设交易指标的相关性越强;考虑到两种预设交易指标的主要数据重叠部分越多以及剩余数据的重叠部分越多,代表两种预设交易指标的相关性越强,获取两种所述预设交易指标的相关特征值;相关特征值越大,代表两种预设交易指标的相关性越强。通过对协方差系数进行基于预设交易指标重要性和相关性的调整,调整后的协方差系数能反映预设交易指标的内在重要性和相关性,可以更有效地处理不同预设交易指标数据大小差异的问题,保障待分析交易数据的异常检测结果的准确性。
1.一种基于5g技术的pos机数据智能化处理方法,其特征在于,所述方法包括以下步骤:
2.根据权利要求1所述的一种基于5g技术的pos机数据智能化处理方法,其特征在于,所述集中分布特征值的获取方法包括:
3.根据权利要求2所述的一种基于5g技术的pos机数据智能化处理方法,其特征在于,所述集中分布特征值的获取方法包括:
4.根据权利要求2所述的一种基于5g技术的pos机数据智能化处理方法,其特征在于,所述区分特征值的获取方法包括:
5.根据权利要求4所述的一种基于5g技术的pos机数据智能化处理方法,其特征在于,所述区分特征值的获取方法包括:
6.根据权利要求4所述的一种基于5g技术的pos机数据智能化处理方法,其特征在于,所述属性密度向量的获取方法包括:
7.根据权利要求4所述的一种基于5g技术的pos机数据智能化处理方法,其特征在于,所述相关特征值的获取方法包括:
8.根据权利要求1所述的一种基于5g技术的pos机数据智能化处理方法,其特征在于,所述调整后的协方差系数的获取方法包括:
9.根据权利要求1所述的一种基于5g技术的pos机数据智能化处理方法,其特征在于,所述获取两种预设交易指标的协方差系数的方法包括:
10.根据权利要求1所述的一种基于5g技术的pos机数据智能化处理方法,其特征在于,所述异常检测结果的获取方法包括: