检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:许斌 梁晓兵 沈博 XU Bin;LIANG Xiaobing;SHEN Bo(China Electric Power Research Institute,Beijing 100192,China;State Key Laboratory of Information Security,Institute of Information Engineering,Beijing 100093,China;School of Cyber Security,University of Chinese Academy of Sciences,Beijing 100049,China)
机构地区:[1]中国电力科学研究院有限公司,北京100192 [2]中国科学院信息工程研究所信息安全国家重点实验室,北京100093 [3]中国科学院大学网络空间安全学院,北京100049
出 处:《计算机工程与应用》2020年第7期116-121,共6页Computer Engineering and Applications
基 金:国家电网公司科技项目(No.JL71-18-022)。
摘 要:针对大数据环境下,非交互式差分隐私无法准确提供及处理大量范围查询的问题,提出一种基于最大信息系数与机器学习的隐私保护数据查询模型。对原始数据集采用最大信息系数选出相关性低的数据作为训练样本集,然后结合差分隐私的并行组合性质对其进行分块划分得到隐私保护的训练样本集,最后应用线性回归算法训练样本集得到差分隐私保护预测模型,该模型隐私保护的方式回答当前提交和大量未知的查询。实验结果表明,所提出的模型在提升发布数据效用性的同时,也提高了查询处理的效率。In the big data environment, non-interactive differential privacy can not accurately provide and deal with a large number of queries. A privacy protection data query model based on maximum information coefficient and machine learning is proposed. Firstly, the data with low correlation is selected as the training sample set by using the maximum information coefficient of the original data set, and then combined with the parallel combination property of differential privacy to obtain the privacy-protected training sample set. Finally, the linear regression algorithm is used to train the sample. The differential privacy protection prediction model answers the current and a large number of unknown queries.The experimental results show that the proposed model improves the efficiency of query processing while improving the utility of published data.
分 类 号:TP309.2[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.119.126.168