检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]北京科技经营管理学院计算机信息工程系,北京102206 [2]哈尔滨工业大学计算机科学与技术学院,黑龙江哈尔滨150001
出 处:《应用科技》2012年第5期48-51,共4页Applied Science and Technology
基 金:国家自然科学基金资助项目(60875013)
摘 要:在数据挖掘隐私保护进行协作数据分析时,部分数据集可能分属不同的数据对象,处理时就需要采取不同的数据失真方法.提出了一组全新的数据失真优化策略,通过将属性划分与奇异值分解法(SVD)、非负矩阵因子分解法(NMF)、离散小波变换法(DWT)相结合,运用4种方案对隐私保护原始数据集的子矩阵进行扰动,并用一些衡量指标来衡量这些策略的效果;利用基于支持向量机(SVM)的二元分类来进行数据实用性的检测.结果表明与数据失真单策略相比,新提出的方案在实现数据隐私和数据实用性的良好平衡方面效果十分显著,为协作数据分析提供了可行性解决方案.In collaborative data analysis of privacy preservation based on data mining, part of the data sets may come from different data objects and may be processed using different data distortion methods. This paper proposes a group of data distortion strategies. By combining the property division with the singular value decomposition (SVD), non-negative matrix factorization (NMF), and discrete wavelet transform (DWT), four schemes are used to disturb the sub-matrix of the original data matrix of privacy preservation, and with some measurable indicators to measure the effectiveness of these strategies. Data utility is examined by using a binary classification method based on the support vector machine (SVM). Experimental results indicate that, in comparison with the individual data distortion techniques, the proposed schemes are very efficient in achieving a good trade-off between data privacy and data utility, providing a feasible solution for collaborative data analysis.
关 键 词:数据失真 数据挖掘 隐私保护 支持向量机 数据分析
分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.15