大数据环境中非交互式查询差分隐私保护模型  被引量:5

Non-interactive Queries Differential Privacy Protection Model in Big Data Environment

在线阅读下载全文

作  者:许斌 梁晓兵 沈博 XU Bin;LIANG Xiaobing;SHEN Bo(China Electric Power Research Institute,Beijing 100192,China;State Key Laboratory of Information Security,Institute of Information Engineering,Beijing 100093,China;School of Cyber Security,University of Chinese Academy of Sciences,Beijing 100049,China)

机构地区:[1]中国电力科学研究院有限公司,北京100192 [2]中国科学院信息工程研究所信息安全国家重点实验室,北京100093 [3]中国科学院大学网络空间安全学院,北京100049

出  处:《计算机工程与应用》2020年第7期116-121,共6页Computer Engineering and Applications

基  金:国家电网公司科技项目(No.JL71-18-022)。

摘  要:针对大数据环境下,非交互式差分隐私无法准确提供及处理大量范围查询的问题,提出一种基于最大信息系数与机器学习的隐私保护数据查询模型。对原始数据集采用最大信息系数选出相关性低的数据作为训练样本集,然后结合差分隐私的并行组合性质对其进行分块划分得到隐私保护的训练样本集,最后应用线性回归算法训练样本集得到差分隐私保护预测模型,该模型隐私保护的方式回答当前提交和大量未知的查询。实验结果表明,所提出的模型在提升发布数据效用性的同时,也提高了查询处理的效率。In the big data environment, non-interactive differential privacy can not accurately provide and deal with a large number of queries. A privacy protection data query model based on maximum information coefficient and machine learning is proposed. Firstly, the data with low correlation is selected as the training sample set by using the maximum information coefficient of the original data set, and then combined with the parallel combination property of differential privacy to obtain the privacy-protected training sample set. Finally, the linear regression algorithm is used to train the sample. The differential privacy protection prediction model answers the current and a large number of unknown queries.The experimental results show that the proposed model improves the efficiency of query processing while improving the utility of published data.

关 键 词:差分隐私 最大信息系数 隐私保护 范围查询 

分 类 号:TP309.2[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象