1、2023 年 5 月 Journal on Communications May 2023 第 44 卷第 5 期 通 信 学 报 Vol.44 No.5基于本地化差分隐私和属性基可搜索加密的区块链数据共享方案 冯涛,陈李秋,方君丽,石建明(兰州理工大学计算机与通信学院,甘肃 兰州 730050)摘 要:针对传统基于云的数据共享方案依赖可信第三方、只关注数据隐私保护或访问控制问题,提出一种基于本地化差分隐私和属性基可搜索加密的区块链数据共享方案。将区块链和云服务器结合,链上链下协同存储数据,提供高效可靠防篡改的数据共享。首先,引入本地化差分隐私对共享数据进行预处理,保证数据拥有者身份隐私的同时
2、抵御不可信第三方攻击;其次,将可搜索加密技术和属性基加密结合,支持密文检索实现数据隐私保护、为共享数据提供细粒度访问控制;最后,通过安全性、正确性证明及实验分析证明所提方案满足安全目标。关键词:区块链;本地化差分隐私;数据共享;属性基可搜索加密;隐私保护 中图分类号:TP309 文献标志码:A DOI:10.11959/j.issn.1000436x.2023103 Blockchain data sharing scheme based on localized difference privacy and attribute-based searchable encryption FENG
3、 Tao,CHEN Liqiu,FANG Junli,SHI Jianming School of Computer and Communication,Lanzhou University of Technology,Lanzhou 730050,China Abstract:Aiming at the problem that traditional cloud-based data sharing schemes rely on trusted third parties and only focus on data privacy protection or access contro
4、l,a blockchain data sharing scheme based on localized differ-ence privacy and attribute-based searchable encryption was proposed.The blockchain and cloud server were combined to store data chain by chain and provide efficient,reliable and tamper-proof data sharing.Firstly,the localization dif-ferenc
5、e privacy was introduced to preprocess the shared data to protect the privacy of the data owner and resist the at-tack of the untrusted third party.Secondly,the searchable encryption technology and attribute-based encryption were combined to realize data privacy protection,support ciphertext retriev
6、al,and provide fine-grained access control for shared data.Finally,the safety,the correctness proof,and the experimental analysis proves that the proposed scheme meets the safety objectives.Keywords:block chain,localized differential privacy,data sharing,attribute-based searchable encryption,privacy
7、 protection 0 引言 近年来,云计算技术不断发展,并且对数据共享的要求越来越严格,目前的数据共享方案要么依赖可信第三方,要么只关注数据隐私保护或访问控制。传统基于云的数据共享方案通常依赖于可信第三方,这些可信第三方可能会存在单点故障、不可追溯、数据维护预算高等问题。现有研究表明1,借助区块链去中心化、数据防篡改以及可追溯的特性,可以为数据共享提供新途径。Fan 等2提出了一个基于区块链的信息管理系统 MedBlock 来处理患者的信息,通过区块链实收稿日期:20221128;修回日期:20230421 基金项目:国家自然科学基金资助项目(No.62162039,No.6176206
8、0);甘肃省科技厅重点研发计划基金资助项目(No.20YF3GA016)Foundation Items:The National Natural Science Foundation of China(No.62162039,No.61762060),The Key Research and De-velopment Program of Gansu Provincial Science and Technology Department(No.20YF3GA016)第 5 期 冯涛等:基于本地化差分隐私和属性基可搜索加密的区块链数据共享方案 225 现高效安全的医疗数据共享,但该系统的安全
9、性完全依赖于区块链技术,不能抵御不可信第三方攻击。Xia 等3提出了一个基于区块链为大数据实体之间云存储库中的共享医疗数据提供数据来源、审计和控制,从而解决医疗大数据管理在无信任环境中共享医疗数据问题的系统,但该系统在共享数据的过程中没有很好地考虑到数据拥有者(Do,data owner)的身份隐私保护。杜瑞忠等4针对数据共享方案中的可信第三方问题,构建了区块链环境下的公钥可搜索加密方案,解决了私有云环境中一对多的数据分享问题,但该方案应用场景单一,不具有可扩展性。在数据共享方案中,为了保护需要共享的数据,首先要解决的是隐私保护问题。在以往的研究中,研究者提出了 K-anonymity5-6、
10、L-diversity7、T-closeness8、M-invariance9的隐私保护模型。由于这些模型不能抵御攻击者的背景知识,于是出现了差分隐私(DP,differential privacy)技术。Hassan等10对区块链中应用差分隐私技术进行了全面调查,并讨论了将差分隐私应用于区块链的各种研究方向,验证了在区块链中引入差分隐私是目前解决身份隐私问题的最佳方案。但传统差分隐私技术通常假设第三方服务器是可信的,不会窃取或者泄露数据拥有者的个人敏感信息。但在实际应用中,真正可信的第三方不成立,本地化差分隐私(LDP,localized differential privacy)技术作为传
11、统差分隐私技术的一种改进技术11-12,可使每个数据拥有者直接对数据进行扰动,将数据隐私化处理掌握在自己手中。由于上传的共享数据不是自己的原始数据,而是对原始数据进行扰动后的数据,因此即使第三方机构不可信,获得的数据也不会泄露数据拥有者的身份隐私,直接杜绝了不可信第三方的攻击,从而在根源上保证了对数据拥有者身份隐私的保护。对于身份隐私保护,若敏感数据泄露,则会暴露数据拥有者的身份,使数据拥有者不愿意共享数据。Liu 等13模拟政府部门间共享统计数据的场景,在区块链环境下提出了一种基于本地化差分隐私的政务数据共享方法,这种方法适用于匿名投票、民意调查等,可以很好地保护数据拥有者的身份信息,但该方
12、法没有提供细粒度访问控制。Sun 等14提出了一种基于区块链的两级隐私保护机制,在第一个阶段,利用本地化差分隐私干扰轨迹的位置信息,以此保护身份隐私;在第二个阶段,所有的传感数据通过边缘节点上传到区块链,由边缘云处理并反馈给请求者,以此保护数据隐私,该方案安全性得到了保证,但验证效率降低了。对于数据隐私保护,研究者提出了可搜索加密(SE,searchable encryption)技术15对关键字进行加密和搜索,以此保证数据隐私及数据可用性。Tang等16使用智能合约为区块链上的多个数据拥有者构建全局加密搜索索引和验证索引,提供了功能齐全的访问控制,以确保患者和医疗机构可以控制对数据的访问,但
13、该方案无法保障数据拥有者的身份信息。牛淑芬等17利用 SE 技术和属性基加密(ABE,attribute-based encryption)技术,设计了一个密文策略的属性基 SE 方案,实现了对加密数据的有效搜索和细粒度访问授权,但容易产生单点故障。对于细粒度访问控制,ABE 技术18被认为是提供细粒度访问控制最有效的解决方案之一。Ding 等19提出了一种在区块链模型下可以进行细粒度访问控制的属性基加密安全访问控制模型,并通过智能合约将所提模型应用于区块链,实现了对区块链用户的访问控制,但不能抵抗不可信第三方攻击。近年来,有研究者开始将数据共享服务中的隐私保护及访问控制相结合考虑。徐红20针
14、对隐私保护及访问控制问题设计了一个基于差分隐私和属性基加密的云数据安全共享机制,避免了未授权用户访问存储在第三方的共享数据,保障了共享数据的安全,但单点故障及不可溯源问题未得到解决。Chen 等21提出了一种基于区块链并且具有基于属性的访问控制和隐私保护的医疗数据共享机制,该机制利用 K-anonymity 和可搜索加密相结合,实现了身份及数据的隐私保护,并可应用在区块链上,利用智能合约实现基于身份的访问控制,但该机制不能抵御不可信第三方攻击。综上所述,虽然目前已有许多研究者提出基于区块链的多种数据共享方案,但这些方案大多只考虑共享数据过程中的隐私保护或访问控制问题,很少有方案将这 2 个问题
15、一起结合考虑。本文在此研究基础上,将隐私保护细分为身份隐私保护和数据隐私保护,构建了区块链环境下的本地化差分隐私和属性基可搜索加密的数据共享方案,并通过理论安全性、正确性证明及实验分析证明了本文方案满足安全目标。226 通 信 学 报 第 44 卷 针对数据共享过程中依赖可信第三方的隐私保护和访问控制问题,本文构建了区块链环境下的本地化差分隐私和属性基可搜索加密的数据共享方案,主要研究工作如下。1)提出了基于本地化差分隐私和属性基加密的区块链数据共享方案,并将隐私保护细分为身份隐私及数据隐私。首先,利用 LDP 技术中的RAPPOR 方法对数据进行预处理,以模糊可能反映数据拥有者(DO)身份的
16、敏感数据,确保 DO身份隐私保护并抵御不可信第三方攻击;然后,利用 SE 技术,实现对加密关键字的搜索,提供数据隐私保护。2)考虑到访问控制问题,本文利用 ABE 技术为共享数据提供灵活的细粒度访问控制。数据访问者(DV,data visitor)可根据感兴趣关键字产生搜索陷门,将相关陷门上传至区块链并进行搜索等操作。DO 有权决定数据能否被访问,可以有效保证共享数据的安全。3)利用区块链和云服务器链上链下协同存储数据,对包含关键字的数据进行索引,将索引和搜索工作放到区块链,扰动后的敏感数据及数据密文存储在云服务器上,解决数据共享依赖可信第三方的问题,保证搜索结果的不可篡改性及溯源性。1 预备知识 1.1 双线性映射 1)双线性。对任意的1,x yG和,Ta bG,有(,)(,)(,)abbaabe xye xye x y。2)非退化性。存在1gG,使(,)1e g g 。3)可计算性。对所有的1,x yG,存在有效算法计算(,)e x y。1.2 判定性双线性 Diffie-Hellman 假设 设G1、G2是阶为素数 p 的循环群,双线性映射112GGG,g是群1G的生成元,随机生