一种基于区块链和差异隐私的车联网隐私数据保护方法与流程

专利2022-05-10  82



1.本发明属于数据处理技术领域,特别涉及一种基于区块链和差异隐私的车联网隐私数据保护方法。


背景技术:

2.在车联网中,为了增强驾驶体验并利用基于位置的服务,需要将车辆形成的数据发送到云平台、rsu和相邻车辆中,另外,智能汽车需共享其位置、身份等信息,但恶意用户可能会发现车辆的真实位置、身份信息等,为防止信息泄露,因此对车辆进行数据保护非常重要。
3.传统的隐私保护方案是使用结构简单的中心化系统,通过权威机构ca集中管理车辆信息,但如果ca 被攻击,将会带来严重的数据安全风险。另外,传统的中心化系统还面临单点故障的风险。作为一种去中心化的技术,区块链被应用到区块链中,现有技术通过将区块链集成到车联网中,以保证车联网的数据不变性,从而保证车联网的安全性并防止数据操控,但作为一种去中心化的数据库,区块链本身并无法直接保证安全性和私密性。往往需要通过与其他技术结合进行隐私保护。
4.中国专利申请,申请号:cn201910400714.4,发明创造名称:一种基于双重假名的车联网隐私数据保护方法,该发明将雾计算技术运用到车辆网隐私数据保护中,基于双重假名算法生成内假名和外假名,再通过雾计算完成车辆与云层之间的交互,使系统具有辨别数据真伪性的能力,同时让恶意用户难以伪造和篡改数据。但是该发明将车辆隐私数据集中存储到云层,面临单点故障问题,一旦云层被攻破,隐私数据可能面临被篡改的风险;采用双重假名的方式,使得需要维护的密钥数量急速增加,造成大量计算资源消耗并牺牲性能。
5.中国专利申请,申请号:cn201910873977.7,发明创造名称:一种基于区块链的隐私数据保护的方法,该发明构建了隐私数据被保护并可授权的区块链网络,采取对称加密技术对加密密钥进行加密,并使用非对称加密技术对加密密钥进行加密,实现了隐私数据的安全性保护。但是该方案中每个用户的身份都是由公钥承载,需要管理大量加密密钥,在实际应用中需要消耗大量的计算资源并牺牲性能。


技术实现要素:

6.本发明的目的是:针对现有车联网数据保护方法中的单点故障问题、计算资源消耗大、密钥管理麻烦等问题,利用差异隐私的数据扰动机制和区块链的去中心化、防篡改能力,提供一种基于差异隐私和区块链的车联网隐私数据保护方法,从而实现车辆隐私数据的分布式管理和保护。
7.本发明公开的一种基于区块链和差异隐私的车联网隐私数据保护方法,采用的技术手段为:考虑传统的数据存储容易面临单点故障的问题,考虑使车联网中的rsu(路侧单元)充当区块链节点,构建区块链网络并进行用户数据存储;设计访问控制策略并通过智能
合约实现车辆隐私数据访问;考虑差异隐私中隐私数据效用和隐私性难以得到平衡的问题,采用基于虚拟对局的博弈论方法合理分配差异隐私迭代过程中的隐私预算分配,同时采用孪生神经网络动态评估差异隐私效果,反向更新隐私预算分配方案。
8.一种基于区块链和差异隐私的车联网隐私数据保护方法,包括以下步骤:s1:车辆周期性地将车辆数据集发送给rsu,并自定义隐私数据访问控制策略和隐私偏好;s2:rsu获取到车辆数据和控制策略后,记录车辆身份信息,采用rock层次聚类算法对数据集进行划分,得到不同隐私偏好的隐私数据集,将数据集存储到区块链网络中;s3:构建神经网络虚拟对局模型,对具有不同隐私偏好的隐私数据集进行隐私预算分配,将车辆和数据访问者作为博弈双方,获取最优隐私预算分配结果,使隐私数据可用性和隐私保护程度达到最优平衡;s4:数据访问者向rsu提供数据访问请求,访问请求由智能合约审核,若满足被访问车辆的隐私数据访问控制策略,rsu则根据被访问数据集的最优隐私预算,形成隐私数据访问数据集,并允许数据访问者访问该数据集,对被访问的隐私数据添加拉普拉斯噪声,使之满足用户的隐私需求和数据访问者的可用性需求;s5:根据所述访问数据集及原始数据集,基于孪生神经网络度量访问数据集的效用,实时评估差异隐私结果,跟踪预测隐私泄露风险,并将其反馈至rsu,调整相应的隐私预算。
9.进一步地,步骤s1中,所述自定义隐私数据访问控制策略为车辆自定义其隐私数据访问策略规则,以控制数据使用者的访问数据时应满足的条件,隐私数据访问策略规则(acs)描述如下:其中,为定义的条件,q为访问条件, id为指定的用户身份属性,a为指定可访问的数据标识;所述自定义隐私偏好为用户自定义其隐私偏好,以控制特定属性数据用途,隐私偏好表示为:其中,name为定义的数据类型,noapplication为数据禁止的用途。
10.进一步地,步骤s2包括以下步骤:s201:将每个车辆数据样本看成一簇,将隐私偏好中的关键字看成一个事务,一个用户可能存在多个事务,以此组成关键字事务集,将关键字事务集的共同邻居数作为数据之间相似度的度量标准,相似度函数表示为:其中,为2簇中预期交叉邻居个数,
为相似度阈值参数,用于确定是否满足邻居条件,为簇中数据点的总数,为簇中数据点的总数,指簇和簇的相同邻居数,值愈大表明a和b同一簇的几率愈大; s202:取相似性度量最高的两个簇或几个簇合并,合并后更新链接矩阵,继续计算不同簇之间的相似性度量,以保证簇内邻居数最大化及簇间邻居数最小化,直到满足目标函数为止,目标函数表示为:其中,k表示最终形成簇的个数,表示簇的大小,表示簇内邻居数,表示预期邻居数;s203:将聚类后的数据封装成交易发送到区块链网络主节点,区块由密码签名、哈希、时间戳、数据组成,交易的一般形式表示为:主节点为交易分配一个唯一的编号,记为,并把pre

prepare消息广播给区块链中的节点,pre

prepare组成为:节点依靠签名字段检查消息是否来源于主节点,确认无误,将请求编号和本节点签名组成投票消息,广播给区块链中其他所有成员;s204:其他所有成员每收到一个投票消息,便把收到的消息和签名一起存在缓存中,在发送的时候带上其中个消息和签名,签名记为,用以证明自己确实收到了个投票;s205:若投票消息数量超过全部节点数量的三分之一,则认为对所有节点广播确认消息,表示该节点可以进行数据上链;s206:将验证通过的交易写入区块链网络中并将交易号和对应的数据集类型返回给车辆,由所有区块链节点共同保护数据。
11.进一步地,步骤s3包括以下步骤:s301:利用nfsp agent构建博弈树,每个博弈者为一个agent,记录博弈双方状态及节点状态,并分别将每轮博弈经验和最佳响应行为记录到两个矩阵中;s302:对记录博弈经验的矩阵中记录的博弈经验采用强化学习中的q

learning方法求解近似最优隐私预算分配策略,迭代公式为:
其中,为学习率,为折扣因子,是指在t时刻agent的状态,指在状态下执行隐私预算分配动作得到的收益,表示在状态下采取隐私预算分配动作a所可以得到的最大奖赏;s303:对记录最佳响应的矩阵中记录的最佳响应行为采用监督学习方法训练平均策略;s304:在博弈过程中,agent随机从和中选择隐私预算分配策略并执行,观察下一状态及奖励,存储到记录的博弈经验的矩阵中,直至执行的为最佳隐私预算分配策略,博弈停止,最后得到最优隐私预算分配。
12.进一步地,步骤s4中,所述访问请求表示为:包括数据访问者的身份属性id,希望访问的数据类型a,访问时的环境信息q,访问数据的用途。
13.进一步地,步骤s4中,添加的拉普拉斯噪声的概率分布为:其中,为位置参数,为敏感度,为初始数据函数,尺度参数,噪声方差为;输出的访问数据集满结果满足以下函数:其中,为原始数据集,为访问数据集,。
14.进一步地,步骤s5包括以下步骤:s501:将输入的原始数据与访问数据集通过结构相同,参数共享的子神经网络映射到目标空间,得到的映射结果分别表示为、,其中,为映射函
数,可将输入的原始数据集与访问数据集分别转换为一组特征向量:其中,x为输入的数据集中的单个数据,为输入的数据集中的最小数据,为输入的数据集中的最大数据;s502:通过相似度度量函数计算、的相似度,得到访问数据集的数据效用,相似度量函数表示为:其中,分子表示两个数据集向量的点乘积,分母表示两个数据集向量的模的积;s503:根据获得的访问数据集的数据效用衡量差异隐私效果,相似度越高代表隐私保护程度越低,隐私泄露风险越高,若,表明隐私预算分配失效,需重新进行隐私预算分配。
15.本发明采用以上技术方案与现有方案相比,具有以下技术效果:(1)本发明利用层次聚类算法实现隐私数据集精准分类;(2)本发明利用神经网络虚拟自我对局方法,结合深度学习算法选取最优隐私预算分配参数,实现数据效用与隐私之间的良好权衡;(3)采用差异隐私与区块链结合的方式,差分隐私对数据进行动态扰动,保证了数据的隐私性,区块链网络的信用共识机制和分布式结构保证了数据上链的安全性和上链数据的不可篡改性;(4)本发明提出的数据保护方法有利于隐私数据的保护,有利于保护区块链的匿名特性,有利于减少车联网中的计算资源消耗。
附图说明
16.图1为基于区块链和差异隐私的车联网隐私数据保护流程。
17.图2为基于区块链和差异隐私的车联网隐私数据访问流程。
具体实施方式
18.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
19.参见图1和图2,本发明公开了一种基于区块链和差异隐私的车联网隐私数据保护
方法,包括以下步骤:步骤s1:数据采集:车辆周期性地将车辆数据集发送给rsu,并自定义隐私数据访问控制策略和隐私偏好。
20.其中,车辆自定义其隐私数据访问策略规则,以控制数据使用者的访问数据时应满足的条件。隐私数据访问策略规则(acs)描述如下:其中为定义的条件,q为访问条件,包括时间等环境信息,id为指定的用户身份属性,可以是年龄、级别、角色或与请求访问者相关的任何其他类型的信息,a为指定可访问的数据标识。
21.用户自定义其隐私偏好,以控制特定属性数据用途,隐私偏好可表示为:其中name为定义的数据类型,noapplication为数据禁止的用途。
22.步骤s2:数据存储:rsu获取到车辆数据和控制策略后,记录车辆身份信息并标记数据集,采用rock(robust clustering using links)层次聚类算法对数据集进行划分,最终得到不同隐私偏好的隐私数据集,将数据集存储到区块链网络中。具体步骤如下:step2.1:采用rock(robust clustering using links)层次聚类算法对数据集进行划分,最终得到不同隐私偏好的隐私数据集。
23.将数据集中每个数据样本看成一簇,将隐私偏好中的关键字看成一个事务,一个用户可能存在多个事务,以此组成关键字事务集,将关键字事务集的共同邻居数作为数据之间相似度的度量标准。相似度函数表示为:其中,为2簇中预期交叉邻居个数,为相似度阈值参数,用于确定是否满足邻居条件,为簇中数据点的总数,为簇中数据点的总数,指簇和簇的相同邻居数,值愈大表明a和b同一簇的几率愈大。
24.取相似性度量最高的两个簇或几个簇合并,合并后更新链接矩阵,继续计算不同簇之间的相似性度量,以保证簇内邻居数最大化及簇间邻居数最小化,直到满足目标函数为止,目标函数表示为:
其中,k表示最终形成簇的个数,表示簇的大小,表示簇内邻居数,表示预期邻居数;step2.2:将聚类后的数据封装成交易发送到区块链网络主节点,区块由密码签名、哈希、时间戳、数据组成,交易的一般形式表示为:主节点为交易分配一个唯一的编号,记为,并把pre

prepare消息广播给区块链中的节点,pre

prepare组成为:节点依靠签名字段检查消息是否来源于主节点,确认无误,将请求编号和本节点签名组成投票消息,广播给区块链中其他所有成员;其他所有成员每收到一个投票消息,便把收到的消息和签名一起存在缓存中,在发送的时候带上其中个消息和签名,签名记为,用以证明自己确实收到了个投票;若投票消息数量超过全部节点数量的三分之一,则认为对所有节点广播确认消息,表示该节点可以进行数据上链;将验证通过的交易写入区块链网络中并将交易号和对应的数据集类型返回给车辆,由所有区块链节点共同保护数据。
25.步骤s3:差异隐私预算分配:对聚类得到的不同车辆隐私数据集进行隐私预算分配。为了达到用户隐私偏好和访问者访问数据集效用间最优平衡,构建神经网络虚拟对局模型,将车辆和数据访问者作为博弈双方,获取每个数据集的最优隐私预算分配。
26.具体步骤如下:step3.1利用nfsp agent构建博弈树,每个博弈者为一个agent,在博弈过程中,数据访问者的目标是最大化车辆隐私数据可用性u,目标函数表示为:其中,为访问到的数据,为车辆自身的隐私数据,为l1范数。
27.车辆的目标是在保护自身隐私数据的情况下最大化自身效用p,目标函数表示为:其中,为访问到的数据,为车辆自身的隐私数据,为l1范数。
28.将每轮博弈经验和最佳响应行为分别记录到名为mrl和msl的两个矩阵中,博弈经验指的是每轮博弈中博弈双方做出的博弈行为,最佳响应指代每轮博弈中博弈双方作出的
使自身效益达到最优的博弈行为;step3.2对mrl矩阵中记录的博弈经验采用强化学习中的q

learning方法训练近似最优隐私预算策略网络。迭代公式为:其中,为学习率,为折扣因子,是指在t时刻agent的状态,指在状态下执行隐私预算分配动作得到的收益,表示在状态下采取隐私预算分配动作a所可以得到的最大奖赏;博弈经验数据以的形式存储在q表中,算法通过迭代公式对q表进行更新,即不断更新博弈经验,直至训练得到最优隐私预算策略网络。
29.对msl矩阵中的记录的最佳响应采用监督学习方法训练得到平均策略网络,利用蓄水池抽样对每轮博弈结束后记录的最佳响应行为进行均匀抽样得到相同数目的经验数据,通过对抽样到的数据进行分类学习将经验数据映射为行动概率,例如,分类学习得到的增加隐私预算样本占总样本的1/2,则该轮博弈中,增加隐私预算的行动概率为0.5,通过抽样整个msl矩阵中样本,构建得到平均策略网络;step3.3在博弈过程中,agent随机从和中选择隐私预算分配策略,为了方便起见,可将概率设置为0.5,并根据对方的平均策略做出当前状态下对自己最有利的反应,反应包括放弃、加注(增加或减少隐私预算以最大化自身目标函数)及跟注(增加或减少与对方相同的隐私预算)。同时根据选择的反应计算新的目标函数值,若新的函数值大于旧的函数值,则更新自身,每轮博弈结束记录博弈状态(该轮博弈后的隐私预算值)及双方目标函数值,存储到mrl矩阵中,直至博弈达到纳什均衡,即满足,此时执行的为最佳隐私预算分配策略,隐私预算分配最优。
30.步骤s4:车辆隐私数据访问:数据使用者向rsu提供数据访问请求,经智能合约认证后的数据访问者获得差异隐私后的访问数据集。
31.数据访问者通过向区块链网络发送访问请求进行特定隐私数据集访问,访问请求表示为:包括数据访问者的身份属性id,希望访问的数据类型a,访问时的环境信息q,访问数据的用途。
32.访问请求由智能合约审核,若满足被访问车辆的隐私数据访问控制策略,rsu则根据被访问数据集的最优隐私预算,形成隐私数据访问数据集,并允许数据访问者访问该数据集,对被访问的隐私数据添加拉普拉斯噪声,使之满足用户的隐私需求和数据访问者的可用性需求;
添加的拉普拉斯噪声的概率分布为:其中,为位置参数,为敏感度,为初始数据函数,尺度参数,噪声方差为;输出的访问数据集满结果满足以下函数:其中,为原始数据集,为访问数据集,。
33.步骤s5:隐私保护效用动态评估反馈:根据所述访问数据集及原始数据集,基于孪生神经网络度量访问数据集的效用,实时评估差异隐私结果,跟踪预测隐私泄露风险,并将其反馈至rsu,调整相应的隐私预算。
34.step5.1将输入的原始数据集与输出的访问数据集通过结构相同、参数共享的子神经网络映射到目标空间,得到的映射结果分别表示为 、,其中,为映射函数,其中,x为输入的数据集中的单个数据,为输入的数据集中的最小数据,为输入的数据集中的最大数据,通过映射函数,输入的数据(即原始数据集和访问数据集)x可转换为特征向量。
35.step5.2通过相似度度量函数计算、的相似度,得到访问数据集的数据效用,相似度量函数表示为:
其中,分子表示两个数据集向量的点乘积,分母表示两个数据集向量的模的积;step5.3根据获得的访问数据集的数据效用衡量差异隐私效果,相似度越高代表隐私保护程度越低,隐私泄露风险越高。若,表明隐私预算分配失效,需重新进行隐私预算分配。
36.以车辆通信行为数据为例,车主以一天为周期,向rsu发送数据集,并设定隐私数据访问控制策略为:定义隐私偏好为:根据上述规则,如果数据访问者的车牌为皖开头,并且访问时间在12:00之后,就可以访问数据集中属性为name的数据,并可将数据用于除注册外所有用途。
37.rsu获取数据集后,根据车主的隐私偏好进行数据集分类,将属性为name的数据单独划分,并将获得的数据集发送到区块链网络中,通过神经网络虚拟自我对局方法获取最优隐私预算分配,以供差异隐私。
38.通过孪生神经网络对获得的差异隐私分配方案进行动态评估,假设获取的隐私预算分配为0.2,若,则博弈结果失效,需重新进行博弈。
39.假设此时某人a希望访问该车主属性为name的数据集,则需要向区块链网络发送访问请求,。
40.经智能合约审核,该访问请求可通过审核,则对a希望访问的数据集进行拉普拉斯噪声添加,并将查询结果返回给a。若访问请求不满足访问控制策略,则不予响应。
41.在本说明书的描述中,参考术语“一个实施例”、“示例”、“具体示例”等的描述意指结合该实施例或示例描述的具体特征、结构、材料或者特点包含于本发明的至少一个实施例或示例中。在本说明书中,对上述术语的示意性表述不一定指的是相同的实施例或示例。而且,描述的具体特征、结构、材料或者特点可以在任何的一个或多个实施例或示例中以合适的方式结合。
42.以上公开的本发明优选实施例只是用于帮助阐述本发明。优选实施例并没有详尽叙述所有的细节,也不限制该发明仅为所述的具体实施方式。显然,根据本说明书的内容,可作很多的修改和变化。本说明书选取并具体描述这些实施例,是为了更好地解释本发明的原理和实际应用,从而使所属技术领域技术人员能很好地理解和利用本发明。本发明仅受权利要求书及其全部范围和等效物的限制。
转载请注明原文地址:https://doc.8miu.com/read-1719387.html

最新回复(0)