Parzen窗核密度估计的大规模数据模式分类隐私保护方法  被引量:2

A Pattern Classification Privacy Preservation Algorithm Based on Parzen Window Kernel Density Estimation for Large Data Set

在线阅读下载全文

作  者:原永滨[1,2] 杨静[1] 张健沛[1] 于旭[3] 

机构地区:[1]哈尔滨工程大学计算机科学与技术学院,哈尔滨150001 [2]福州大学电气工程与自动化学院,福州350108 [3]青岛科技大学信息科学与技术学院,青岛266001

出  处:《科技导报》2014年第36期104-109,共6页Science & Technology Review

基  金:国家自然科学基金项目(61073041;61073043;61370083;61402126);黑龙江省自然科学基金项目(F200901);福建省自然科学基金项目(2011J1296);高等学校博士学科点基金项目(20112304110011;20112304110012)

摘  要:针对大规模数据集上的模式分类任务,提出基于Parzen窗核密度估计的模式分类隐私保护算法。利用Parzen窗算法对原始大规模训练集服从的概率密度进行估计,根据估计的概率密度函数构造la个替换训练样本,其中l为原始样本的数目,a通过10折交叉验证方式确定。最后发布替换训练样本进行模式分类,以实现原始数据上的隐私保护。在Adult数据集上的仿真实验充分验证了算法的有效性。In this paper, a pattern classification privacy preservation algorithm is proposed based on the Parzen window kernel density estimation on large scale dataset. Firstly, the probability density is estimated through the original large scale training set. Then the replacement training samples are constructed by the estimated probability. Finally, the replacement training samples are published for the pattern classification training. Thus the privacy on the original training set can be protected effectively. The simulation experiments on Adult datasets fully verify the effectiveness of the proposed algorithm.

关 键 词:PARZEN窗 核密度估计 数据发布 隐私保护 

分 类 号:TP309[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象