检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]中国电信股份有限公司北京研究院,北京10003 [2]北京大学信息科学技术学院,北京100871
出 处:《计算机学报》2007年第8期1267-1276,共10页Chinese Journal of Computers
基 金:国家自然科学基金(60403041);北京市科学技术委员会博士论文专项基金(ZZ6027)资助~~
摘 要:数据挖掘中的隐私保护方法,试图在不精确访问原始数据详细信息的条件下,挖掘出准确的模式与规则.围绕着分类挖掘中的隐私保护问题展开研究,给出了一种基于数据处理和特征重构的朴素贝叶斯分类中的隐私保护方法.分别提出了一种针对枚举类型的隐私数据处理与特征重构方法——扩展的部分隐藏随机化回答(Extended Randomized Response with Partial Hiding,ERRPH)方法和一种针对数值类型的隐私数据处理与特征重构方法——转换的随机化回答(Transforming Randomized Response,TRR)方法,并在此基础上实现了一个完整的隐私保护的朴素贝叶斯分类算法.理论分析和实验结果均表明:朴素贝叶斯分类中基于ERRPH和TRR的隐私保护方法具有很好的隐私性、准确性、高效性和适用性.Privacy preserving data mining is to discover accurate patterns without precise access to the original data. This paper focuses on privacy preserving classification, and presents a privacy preserving Naive Bayes classification approach based on data randomization and feature reconstruction. An ERRPH (Extended Randomized Response with Partial Hidding) method and a TRR (Transforming Randomized Response) method are respectively presented for enumerated data and numerical data. Then, a privacy preserving Naive Bayes classification algorithm is implemented based on those methods. Theoretical analyses show that it can provide better privacy, accuracy, efficiency, and applicability. The effectiveness is also verified by experiments.
关 键 词:数据挖掘 隐私保护 朴素贝叶斯分类 随机处理 特征重构
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7