一种保护原始数据的多属性值分类挖掘算法  

Algorithm for privacy-preserving classification mining with multivariate data

在线阅读下载全文

作  者:李兴国[1] 周志纯[1] 刘辉[1] 

机构地区:[1]合肥工业大学管理学院,合肥230009

出  处:《计算机应用研究》2008年第8期2332-2334,共3页Application Research of Computers

基  金:国家自然科学基金资助项目(70631003);安徽省人文社科基地研究项目(2006sk008)

摘  要:针对基于随机响应的隐私保护分类挖掘算法仅适用于原始数据属性值是二元的问题,设计了一种适用于多属性值原始数据的隐私保护分类挖掘算法。算法分为两个部分:a)通过比较参数设定值和随机产生数之间的大小,决定是否改变原始数据的顺序,以实现对原始数据进行变换,从而起到保护数据隐私性的目的;b)通过求解信息增益比例的概率估计值,在伪装后的数据上构造决策树。Randomized response technique was used in privacy-preserving classification mining, and had acquired good resuits. But the method was only fit for binary data. To solve this problem, this paper dasigned an algorithm which was fit for multivariate data for privacy-preserving classification mining. The algorithm divided into two parts. In the first part, compared the size of parameter and random generated number to decide whether the sequence of the original data should be changed or not, in order to disguise the original data and then protected the privacy of data. In the second part, estimated the value of gain ratio to build the decision tree on disguised data.

关 键 词:数据挖掘 隐私保护 分类 决策树 

分 类 号:TP309[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象