面向差分隐私的BIRCH算法研究  被引量:2

BIRCH Hierarchy Clustering Algorithm for Differential Privacy Protection

在线阅读下载全文

作  者:王豪石 张淑芬 董燕灵 李帅 WANG Hao-shi;ZHANG Shu-fen;DONG Yan-ling;LI Shuai(College of Science,North China University of Science and Technology,Tangshan 063210,China;Hebei Key Laboratory of Data Science and Application,Tangshan 063210,China;Tangshan Key Laboratory of Data Science,Tangshan 063210,China)

机构地区:[1]华北理工大学理学院,河北唐山063210 [2]河北省数据科学与应用重点实验室,河北唐山063210 [3]唐山市数据科学重点实验室,河北唐山063210

出  处:《软件导刊》2022年第4期116-120,共5页Software Guide

基  金:国家自然科学基金项目(U20A20179)。

摘  要:利用层次方法的平衡迭代规约和聚类(BIRCH)算法是层次聚类算法的一种,也是机器学习算法的一种。随着机器学习的日益发展,在机器学习中如何保护隐私成为目前研究的热点问题。差分隐私是数据分析保护中的新技术,其特点之一是数据在被不同的参数处理后具有可比较性。针对机器学习中的隐私泄露现象,提出面向差分隐私的BIRCH算法(DPBIRCH),在构建聚类特征树的过程中对聚类特征添加拉普拉斯噪声,解决了聚类特征中的隐私泄露问题。通过对实验中隐私预算参数的取值和聚类准确性的结果分析,DPBIRCH算法能够在隐私预算参数取值范围内且保证聚类准确性的前提下,实现对数据隐私提供不同程度级别的隐私保护。Balanced Iteration Protocol and Clustering(BIRCH)algorithm using hierarchical method is a kind of hierarchical clustering algo⁃rithm,and also a kind of machine learning algorithm.With the development of machine learning,how to protect privacy in machine learning has become a hot research issue.Differential privacy is a new technology in data analysis and protection.One of its characteristics is that data can be compared after being processed by different parameters.Aiming at the privacy leakage phenomenon in machine learning,a differential privacy-oriented BIRCH(DPBIRCH)algorithm was proposed.Laplacian noise was added to the clustering feature tree to solve the privacy leakage phenomenon in the clustering feature.By analyzing the values of privacy budget parameters and the results of clustering accuracy in the experiments,DPBIRCH algorithm can provide different levels of privacy protection for data privacy within the range of privacy budget pa⁃rameters and on the premise of ensuring clustering accuracy.

关 键 词:机器学习 BIRCH算法 差分隐私保护 拉普拉斯机制 

分 类 号:TP309[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象