1、基金项目:2020 年重庆邮电大学移通学院校级课题(YTJG2020492)收稿日期:20211029修回日期:20211125第 40 卷第 2 期计算机仿真2023 年 2 月文章编号:10069348(2023)02053005混合云存储下物联网隐私数据保护模型研究闫攀1,周莉1,闫会峰2(1 重庆移通学院大数据与计算机科学学院,重庆 401520;2 重庆邮电大学软件工程学院,重庆 400065)摘要:目前物联网隐私数据保护模型没有对物联网数据进行预处理,存在信息损失度高、数据可用性差、模型性能差以及安全性差的问题。提出混合云存储下物联网隐私数据保护模型研究方法。方法首先对物联网隐私数
2、据进行数据清理、数据变换以及损失量计算的预处理,保证数据能更加适应数据保护模型,其次分别对物联网隐私数据以及用户信息进行加密处理,并在混合云的基础上构建出带有四层模块的保护模型,将加密技术添加到模型中,实现物联网隐私数据保护。实验结果表明,所提方法的信息损失度低、数据可用性高、模型性能好以及安全性高。关键词:混合云;物联网;隐私数据;预处理;数据变换中图分类号:TP393文献标识码:Besearch on Privacy Data Protection Model of Internetof Things under Hybrid Cloud StorageYAN Pan1,ZHOU Li1,
3、YAN Huifeng2(1 School of Big Data Computer Science Engineering of Chongqing Collegeof Mobile Communication,Chongqing 401520,China;2 School of Software Engineering of Chongqing University of Postsand Telecommunications,Chongqing 400065,China)ABSTACT:At present,some models ignore preprocessing the IoT
4、 data during the privacy data protection,leadingto the problems such as high information loss and low data availability This paper proposed a method focusing on theresearch of IoT privacy data protection model based on hybrid cloud storage was proposed Firstly,this method pre-processed the IoT priva
5、cy data,such as the data cleaning,data transformation and loss calculation,to ensure that thedata could be more adapted to the data protection model Secondly,the method encrypted private data and user infor-mation,and built a protection model with fourlayer modules based on hybrid cloud Finally,the
6、encryption technol-ogy was applied to the model Thus,the protection for IoT privacy data was achieved Experimental results show thatthe proposed method has low information loss,high data availability,good performance and high securityKEYWODS:Hybrid cloud;Internet of things;Private data;Preprocessing
7、;Data transformation1引言随着物联网技术的成熟,物联网数据越来越多,为保证数据库内容的完整性,可在混合云1 的基础上进行保存,云计算2 是基于互联网技术的新兴计算方法,这种方法可在高效计算的同时保证数据的存储效率,为用户提供便利。但因为云计算的资源不是本地化,因此数据在上传过程中可能存在数据丢失或盗取的问题3,严重影响云计算用户数据的安全,为避免混合云下的数据被盗取,现对物联网隐私数据保护模型展开研究。佘维4 等人首先在区块链技术的帮助下将物联网系统装置进行标记,保证其不被篡改,其次在白名单的基础上完成哈希表网络,以此隐藏物联网隐私数据,实现物联网隐私数据保护。许斌5 等人
8、在物联网隐私数据中筛选出最大信息系数将其视为训练样本集,其次基于差分隐私方法将数据集进行分类,最终在线性回归算法的基础上得出隐私数据保护模型,实现物联网隐私数据保护。035以上两种方法在对隐私数据保护过程中没有对数据进行预处理,导致数据中有很多残缺或带有噪声的数据,同时大部分数据不能适用于数据保护模型,大大降低了保护模型的性能,从而导致信息损失度高、数据可用性差、模型性能差以及安全性差。为了解决上述方法中存在的问题,提出混合云存储下物联网隐私数据保护模型研究方法。2物联网隐私数据预处理由于物联网隐私数据中带有很多错误数据,在对其进行保存前需要进行数据的预处理67,排除其中的噪声。同时需要将数据
9、进行变换,以此保证数据的合法化,同时提高加密效率,进而为隐私数据保护模型的构建奠定基础。2.1物联网隐私数据清理因为物联网隐私数据不能随意丢弃,即使数据中含有残缺数据或数据带有噪声也只能将其进行保存,从而降低了隐私数据的安全性,为提高隐私数据保护性能,可提前对数据进行清理8,数据的清理也是对残缺数据的填补,在均值替换法的帮助下降低数据间的相似影响程度,并中和数据规范方法将零值视为数据敏感属性的缺失值,从而得出隐私数据的填补公式,其表达式为lost=ni=1xin0(1)式中,xi代表物联网隐私数据,n 代表数据的个数。假设物联网隐私数据集为 T,将其中的准标识符当成目标构建出多维的向量模型 M
10、,T 中的目标也是模型 M 的目标t,当目标 t 没有被标记为噪声或分类为某个簇中的一员时,需对周围的目标进行运算,当模型中的目标小于密度阈值,可直接将小于阈值的目标标记为噪声,反之则构建簇 C,同时将目标 t 和周围目标添加到簇 C 中,筛选出全部未被标记或未分类到簇中的对象,当其大于密度阈值,直接将其周围数据添加到簇 C 中;当数据不在任何簇中,可直接将该数据视为已标记过的数据,根据以上对数据处理的步骤将全部数据进行标记处理,从而得出所有带有噪声的数据,并对其进行清理。2.2数据变换物联网隐私数据通常分为数值型和分类型,但这种形式的数据不适用于物联网隐私数据保护模型,需分别对两种数据进行变
11、换。数值型数据可直接在 zscore 规范化的方法下对其进行变换,简而言之就是将数据的属性在其均值和标准差的基础上进行规范化处理,其规范化公式为v=v ni=1xin()/A(2)式中,v代表数据的属性值经过规范化处理后的结果,v 代表数据的属性值,A代表属性 X 的标准值。分类型数据与数值型数据除了常规差异以外,两者最大的区别就是分类型数据之间的距离相等,用公式进行表示为|Xi Xj|=(3)式中,Xi和 Xj均代表分类型数据,代表任意两分类型数据之间的距离。为降低分类型数值转换的误差,可在泛化的基础上进行数据转换,从而保证隐私数据保护模型的性能。2.3信息损失度量待保护的物联网数据由于准标
12、识符的原因导致部分数据出现一定的损失量,为提高信息损失量的测量精度,精确填补信息,需要分别对数值型与分类型数据进行测量。2.3.1数值型属性信息损失量数值型数据属性的泛化就是提取出更大范围的区间值,计算此类损失量前需要将泛化前后的差异值以及全域值求解出来,并计算出两者之间的比值得出信息的损失,从而得出数值型属性的信息损失度量,其表达式为Ldigit(x,x)=(xmin xmin)+(xmax xmax)/(Amax Amin)0(4)式中,x 代表未经过泛化处理的损失量,x代表经过泛化处理后的损失量,xmax代表损失量的最大值,xmin代表损失量的最小值,xmin代表经过泛化处理后的损失量最
13、小值,xmax代表经过泛化处理后的损失量最大值,Amax代表区域值中属性 A 的最大值,Amin代表区域值中属性 A 的最小值。2.3.2分类型属性信息损失度量分类型属性在求解信息损失量的过程中需要利用泛化树的高度进行计算,因此计算前需求解出泛化数的高度,并得出泛化前后属性值的层次,同时求解出层次的高度差,最终计算出泛化树高度与层次高度之间的比值,从而得出分类型属性的信息损失度量,其表达式为Lclassify(x,x)=(hx hx)/hA0(5)式中,hx代表属性在泛化树中的高度,hx代表泛化后属性值在泛化树中的高度。根据以上方法可完整计算出信息损失量,并将其进行填补处理,保证数据的完整。3
14、物联网隐私数据保护3.1物联网数据加密由于物联网中的数据过多,为保证数据的安全需对数据进行加密,在海量数据面前,仅仅利用常规方法进行属性分解以及加密会导致密钥出现巨大差异,而大量密钥会占据过多内存,因此只能在混合云的基础上对其进行存储,为了降低密钥存储空间密度,可利用动态加密方法对物联网隐私数据进行处理。135在动态过程中产生的密钥均是独一无二的,且混合云中的密钥均可被利用,因为在密文解密的过程中,不可避免出现很多密文需要共享同一明文的情况,由于物联网隐私数据的位置不尽相同,因此所形成的密文也均存在较小差别。假设物联网内某数据为 aij,当 aij中的元素 j1大于 j2,则j2=mod j1
15、;当元素 j1小于 j2,且 ji=j1,当元素 j1等于 j2时,即可停止运算,此时数据 aij1等于 aij2,令数据 aij内的属性序号为 i,利用 aij2实现数据加密,其密钥的表达式为MK=nj=1(i aj)(6)式中,i代表密钥运算中的平衡系数。式(1)不仅可求解出密钥,也可将其视为密钥的第一次动态变换。根据该原理得出密钥的第二次动态变换表达式为Kij=f(aij)=sj=1MK(mod j)j=sj=1nj=1aj i(mod j)j(7)式中,j代表第二次动态变换的平衡系数。假设物联网数据关系集为,利用最小加密粒度数竖向将其进行分解,从而得到满足物联网隐私数据要求的属性集合
16、F=F1,F2,将属性 F 进行分解后可得出有限元 C=c1,c2,cm,其中的元素为=a1,a2,cn。假设有限元公式为Kij=f(aij)NijCij=g(Kij,Nij)(8)式中,Nij代表数值型数据,其值域范围为 d,d,g 代表元祖的系数。从而得出动态变换公式为Kij=Kij(mod|d|)(9)经过随机变换完成动态加密,其中Cij=Nij+KijNij=g(Kij,Cij)=Cij Kij=Cij Kij(mod|d|)(10)在式(5)的帮助下对物联网数据进行加密,并在式(2)的基础上进行解密,完成物联网隐私数据的保护。3.2物联网用户数据隐私保护对物联网隐私数据的保护不仅需要对数据进行加密,还需对用户自身信息进行保护。假设最新生成的数据关系的元祖数据为(t1,t2,tn),根据对用户信息进行加密,加密公式为U=Ek(T)(11)式中,E 代表对称加密算法,T 代表元祖数据合集,U 代表用户信息加密结果。则用户信息解密公式为T=E1k(U)(12)假设 f 为动态交换加密函数,在不同密钥的帮助下可求解出用户信息的加密和解密结果,经计算两者之间的结果均相同,其表达式为fk