1、2023 年 4 月 Chinese Journal of Network and Information Security April 2023 第 9 卷第 2 期 网络与信息安全学报 Vol.9 No.2 分布式用户隐私保护可调节的云服务个性化 QoS 预测模型 许建龙,林健,黎宇森,熊智(汕头大学工学院,广东 汕头 515063)摘 要:个性化服务质量(QoS,quality of service)预测是构建高质量云服务系统的重要环节,传统基于协同过滤方法采用集中式的训练模式难以保护用户隐私,为了在获取高准确预测效果的同时有效保护用户隐私,提出分布式用户隐私保护可调节的云服务个性化 Q
2、oS 预测模型(DUPPA)。该模型采用“服务器多用户”架构,服务器协调多个用户,处理多用户上传模型梯度和下载全局模型的请求并维护全局模型参数。为进一步保护用户隐私,提出用户隐私程度调节策略,通过调节本地模型参数初始化比例、梯度上传比例以平衡隐私程度和预测精度。在本地模型初始化阶段,用户计算本地模型与全局模型的差值矩阵,并选择差值矩阵中数值较大元素所对应的全局模型参数初始化本地模型参数;在梯度上传阶段,用户可选择部分重要的梯度上传至服务器来满足不同应用场景对隐私保护的需求。为了评估 DUPPA 的隐私程度,提出针对分布式矩阵分解模型梯度共享方案的数据重构攻击方法。实验结果表明,当DUPPA在梯
3、度上传比例为0.1、本地模型参数初始化比例为 0.5 时,预测的平均绝对误差(MAE,mean absolute error)和均方根误差(RMSE,root mean square error)较传统的集中式矩阵分解模型分别降低了 1.20%和0.91%;当 DUPPA 的梯度上传比例为0.1 时,隐私程度至少是梯度上传比例为 1 时的 5 倍;当 DUPPA 的本地模型参数初始化比例为 0.5 时,隐私程度至少是本地模型参数初始化比例为 1 时的 3.44 倍。关键词:云服务;隐私保护;分布式矩阵分解;服务质量预测 中图分类号:TP309 文献标志码:A DOI:10.11959/j.is
4、sn.2096109x.2023022 Distributed user privacy preserving adjustable personalized QoS prediction model for cloud services XU Jianlong,LIN Jian,LI Yusen,XIONG Zhi School of Engineering,Shantou University,Shantou 515063,China 收稿日期:20220419;修回日期:20230221 通信作者:许建龙, 基金项目:国家自然科学基金(61702318);广东省基础与应用基础研究基金(2
5、023A1515010707,2021A1515012527);广东省科技专项资金(“大专项+任务清单”)项目(STKJ2021201);广东省普通高校重点领域专项(2022ZDZX1008)Foundation Items:The National Natural Science Foundation of China(61702318),Guangdong Province Basic and AppliedBasic Research Fund(2023A1515010707,2021A1515012527),Guangdong Science and Technology Specia
6、l Fund Project(“Major Project+Task List”)(STKJ2021201),Special Projects in Key Fields of Guangdong Universities(2022ZDZX1008)引用格式:许建龙,林健,黎宇森,等.分布式用户隐私保护可调节的云服务个性化 QoS 预测模型J.网络与信息安全学报,2023,9(2):70-80.Citation Format:XU J L,LIN J,LI Y S,et al.Distributed user privacy preserving adjustable personalized
7、 QoS predictionmodel for cloud servicesJ.Chinese Journal of Network and Information Security,2023,9(2):70-80.第 2 期 许建龙等:分布式用户隐私保护可调节的云服务个性化 QoS 预测模型 71 Abstract:Personalized quality of service(QoS)prediction is crucial for developing high-quality cloud service system.However,the traditional collabor
8、ative filtering method,based on centralized training,presents challenges in protecting user privacy.In order to effectively protect user privacy while obtaining highly accurate prediction effect,a distributed user privacy adjustable personalized QoS prediction model for cloud services(DUPPA)was prop
9、osed.The model adopted a“server-multi-user”architecture,in which the server coordinated multiple users,handled multiple users requests for uploading model gradients and downloading global model,and maintained global model parameters.To further protect user privacy,a user privacy adjustment strategy
10、was proposed to balance privacy and prediction accuracy by adjusting the initialization proportion of local model parameters and gradient upload proportion.In the local model initialization stage,the user calculated the difference matrix between the local model and the global model,and selected the
11、global model parameters corresponding to the larger elements in the difference matrix to initialize the local model parameters.In the gradient upload stage,the user can select some important gradients to upload to the server to meet the privacy protection requirements of different application scenar
12、ios.To evaluate the privacy degree of DUPPA,a data reconstruction attack method was proposed for the distributed matrix factorization model gradient sharing scheme.The experimental results show that when DUPPA sets the gradient upload proportion to 0.1 and the local model parameter initialization pr
13、oportion to 0.5,the predicted MAE and RMSE are reduced by 1.27%and 0.91%,respectively,compared with the traditional centralized matrix factorization model.Besides,when DUPPA sets the gradient upload proportion to 0.1,the privacy degree is 5 times higher than when the gradient upload proportion is 1.
14、And when DUPPA sets the local model parameter initialization proportion to 0.5,the privacy degree is 3.44 times higher than when the local model parameter initialization proportion is 1.Keywords:cloud service,privacy protection,distributed matrix factorization,quality of service prediction 0 引言 随着云计
15、算技术发展,互联网上出现了越来越多的云服务,用户可根据需要调用这些云服务来构建高质量云计算应用系统,随着云服务数量呈指数级增长,大量等价或类似功能的候选服务应运而生,如谷歌、亚马逊等互联网公司通过云平台为开发者提供数以万计的云服务1-2。为了从众多候选服务中选择最合适服务以满足用户个性化需求,云服务的非功能性属性服务质量(QoS)成为主要关注的指标3。用户可通过调用云服务来获得其 QoS 值(包括吞吐量、响应时间、可靠性等)从而判断云服务质量的优劣,以此来筛选合适的云服务。然而,用户如果每次都调用所有服务再通过排序其 QoS 值来选择出最优 QoS 值,将付出大量代价。解决这个问题的有效方法是
16、收集大量用户调用云服务的历史 QoS 值,在此基础上对未知云服务的QoS 值进行预测4。目前,众多学者采用以协同过滤为主的QoS 预测方法5,为了获取更准确的 QoS值,很多学者在传统方法的基础上融合了地理位置6、时间信息7、上下文信息8等因素,构建更加优越的预测模型。尽管这些方法能较准确预测出未知服务的QoS 值,但仍然存在以下主要问题。传统的集中式训练方法需要较高存储成本9,因为集中式训练方法需要中心云服务器收集分散的用户原始数据并进行建模,但用户和云服务数量激增所产生的数以百万计的QoS值将加重云中心数据存储压力。集中式存储原始数据具有高隐私风险10,因为第三方可能利用收集到的用户数据推断个人信息或将用户数据转售给其他企业以谋取利益。相关法律,如通用数据保护条例11(GDPR,general data protection regulation)对收集和使用用户数据有严格的规定,要求企业或组织只能为特定目的收集和处理最低数量个人信息,这无疑给集中式存储数据带来了挑战。此外,对于分布式用户来说,在训练预测模型过程中,若共享原始数据,则存在较高的隐私泄露风险;若共享模型权重或梯度则可