本公开涉及数据处理,具体地,涉及一种差分隐私加噪方法、装置、介质及电子设备。
背景技术:
1、差分隐私(differential privacy,简称dp)是一种隐私保护手段,主要用于聚合统计数据的保护,可以在保持数据整体统计特征稳定的情况下保护个体的敏感信息。其主要做法是在统计结果中加入适量噪音,以确保修改数据中一条个体记录不会对统计结果造成显著影响,旨在解决数据的统计发布过程中的用户隐私泄露问题。其中,敏感度是决定加入噪音大小的关键参数,它指删除数据集中任一记录对查询结果造成的最大改变。
2、然而,在复杂结构化查询语言(structured query language,sql)中,从数据库直接得到的字段会经历各类加工合成,如指数计算和函数计算,而这些加工后的字段无法直接计算出敏感度。同时,由于复杂sql中通常包含各类嵌套子查询,最外层的查询字段通常来自于多个不同的内部查询字段,这种情况下最外层的查询字段也无法直接计算敏感度。
技术实现思路
1、提供该
技术实现要素:
部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该发明内容部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的保护的技术方案的范围。
2、第一方面,本公开提供一种差分隐私加噪方法,包括:接收基于结构化查询语言sql的查询语句,将所述查询语句转化成抽象语法树;根据所述抽象语法树,分割构建查询块列表,所述查询块列表包括多个子查询,并确定各个子查询之间的依赖引用关系;所述子查询是基于筛选字段分割出的空查询语句;根据所述查询块列表和各个子查询之间的依赖引用关系,构建各子查询各自对应的虚拟物理表并在所述虚拟物理表中更新元数据信息,所述元数据信息包括上下界信息,各子查询的元数据信息是基于子查询和其所依赖的子查询相关的来自物理表的数据源信息,并通过子查询对应的源表达式计算生成;根据所述抽象语法树和各子查询各自对应的虚拟物理表,对各子查询进行sql子句填充,得到各子查询各自对应的目标子查询;所述目标子查询是能够在数据库中独立运行的查询语句;基于加噪子查询的虚拟物理表中的元数据信息计算所述加噪子查询中目标加噪点的敏感度;所述加噪子查询为待进行差分隐私处理的所述目标子查询,所述敏感度作为所述差分隐私处理的参考元素。
3、第二方面,本公开提供一种差分隐私加噪装置,包括:转化模块,用于接收基于结构化查询语言sql的查询语句,将所述查询语句转化成抽象语法树;分割模块,用于根据所述抽象语法树,分割构建查询块列表,所述查询块列表包括多个子查询,并确定各个子查询之间的依赖引用关系;所述子查询是基于筛选字段分割出的空查询语句;构建模块,用于根据所述查询块列表和各个子查询之间的依赖引用关系,构建各子查询各自对应的虚拟物理表并在所述虚拟物理表中更新元数据信息,所述元数据信息包括上下界信息,各子查询的元数据信息是基于子查询和其所依赖的子查询相关的来自物理表的数据源信息,并通过子查询对应的源表达式计算生成;
4、填充模块,用于根据所述抽象语法树和各子查询各自对应的虚拟物理表,对各子查询进行sql子句填充,得到各子查询各自对应的目标子查询;所述目标子查询是能够在数据库中独立运行的查询语句;计算模块,用于基于加噪子查询的虚拟物理表中的元数据信息计算所述加噪子查询中目标加噪点的敏感度;所述加噪子查询为待进行差分隐私处理的所述目标子查询,所述敏感度作为所述差分隐私处理的参考元素。
5、第三方面,本公开提供一种计算机可读介质,其上存储有计算机程序,该程序被处理装置执行时实现本公开第一方面提供的所述差分隐私加噪方法的步骤。
6、第四方面,本公开提供一种电子设备,包括:存储装置,其上存储有计算机程序;处理装置,用于执行所述存储装置中的所述计算机程序,以实现本公开第一方面提供的所述差分隐私加噪方法的步骤。
7、在上述技术方案中,将复杂sql语句划分为多个能够在数据库中独立运行的目标子查询,这在结构上完成了语法化简化;并且,根据查询块列表中的各子查询之间的依赖引用关系,构建各子查询各自对应的虚拟物理表,简化了分析层级。另外,各目标子查询的虚拟物理表中的元数据信息包括上下界信息,这样,根据目标子查询自身拥有的元数据信息,即可实现待进行的差分隐私处理的目标子查询中目标加噪点的敏感度计算,将一个复杂的sql敏感度计算问题被简化为在每个简单的子查询上计算敏感度,从而解决了无法直接计算复杂sql的差分隐私敏感度的问题。
8、本公开的其他特征和优点将在随后的具体实施方式部分予以详细说明。
1.一种差分隐私加噪方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,在所述基于加噪子查询的虚拟物理表中的元数据信息计算所述加噪子查询中目标加噪点的敏感度的步骤之前,所述方法还包括:
3.根据权利要求2所述的方法,其特征在于,在所述基于加噪子查询的虚拟物理表中的元数据信息计算所述加噪子查询中目标加噪点的敏感度的步骤之前,所述方法还包括:
4.根据权利要求1-3中任一项所述的方法,其特征在于,所述根据所述查询块列表和各个子查询之间的依赖引用关系,构建各子查询各自对应的虚拟物理表并在所述虚拟物理表中更新元数据信息,包括:
5.根据权利要求4所述的方法,其特征在于,所述确定各子查询的虚拟列的元数据信息,包括:
6.根据权利要求1-3中任一项所述的方法,其特征在于,所述方法还包括:
7.根据权利要求6所述的方法,其特征在于,所述基于加噪子查询的虚拟物理表中的元数据信息计算所述加噪子查询中目标加噪点的敏感度,包括:
8.一种差分隐私加噪装置,其特征在于,包括:
9.一种计算机可读介质,其上存储有计算机程序,其特征在于,该程序被处理装置执行时实现权利要求1-7中任一项所述方法的步骤。
10.一种电子设备,其特征在于,包括: