基于贝叶斯网络与语义树的隐私数据发布方法  被引量:9

Privacy Data Publishing Method Based on Bayesian Network and Semantic Tree

在线阅读下载全文

作  者:郝志峰[1,2] 王日宇 蔡瑞初 温雯[1] HAO Zhifeng;WANG Riyu;CAI Ruichu;WEN Wen(School of Computers,Guangdong University of Technology,Guangzhou 510006,China;School of Mathematics and Big Data,Foshan University,Foshan,Guangdong 528000,China)

机构地区:[1]广东工业大学计算机学院,广州510006 [2]佛山科学技术学院数学与大数据学院,广东佛山528000

出  处:《计算机工程》2019年第4期124-129,共6页Computer Engineering

基  金:广东省自然科学基金(2014A030306004;2014A030308008);广东省科技计划项目(2015B010108006;2015B010131015);广东特支计划(2015TQ01X140);广州市珠江科技新星(201610010101);广州市科技计划项目(201604016075)

摘  要:为在隐私预算相同的条件下提高发布数据的可用性,在PrivBayes的基础上,提出一种改进的隐私数据发布方法PrivBayes_Hierarchical。基于贝叶斯网络隐私数据发布方法的思想,引入语义树对含有层次关系的数据属性进行抽象,使用贝叶斯网络描述数据属性之间的依赖关系。利用格雷码减少随机噪声对数据精度的影响,并对贝叶斯网络结构学习方法进行优化,以减少不必要的隐私预算消耗,提高数据可用性。实验结果表明,该方法在公开数据集下可以获得比PrivBayes更高的数据精度,从而提升隐私数据集的可用性。In order to improve the availability of published data under the same privacy budget,an improved privacy data publishing method PrivBayes_Hierarchical is proposed based on PrivBayes.Based on the idea of Bayesian network privacy data publishing method,semantic tree is introduced to abstract the data attributes with hierarchical relationships,and Bayesian network are used to describe the dependencies between data attributes.Using Graycode to reduce the impact of random noise on the data accuracy and to optimize the Bayesian network structure learning method to reduce unnecessary privacy budget consumption and improve the availability of data.Experimental results show that this method can obtain higher data precision than PrivBayes for public data and improve the availability of private data sets.

关 键 词:差分隐私 数据发布 贝叶斯网络 数据分析 隐私保护 

分 类 号:TP309.2[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象