不完整数据的聚类研究  

Research on Incomplete Data Clustering

在线阅读下载全文

作  者:冷泳林[1] 张清辰[2] 鲁富宇[1] 

机构地区:[1]渤海大学信息科学与技术学院,辽宁锦州121000 [2]大连理工大学软件学院,辽宁大连116620

出  处:《河南科学》2014年第11期2259-2262,共4页Henan Science

基  金:辽宁省自然科学基金(2013020014);中国高等职业技术教育研究会规划课题(GZYGH1213036;GZYGH1213035);省社科联2014年度辽宁经济社会发展立项课题(20141slktzijy-08)

摘  要:数据采集过程中存在大量缺失数据,即不完整数据.传统方法在聚类不完整数据时采用填充或丢弃缺失数据方式实现数据的聚类.依据不完整信息系统理论提出一种基于K-means的不完整数据聚类算法,算法首先将数据集划分成完整数据集和非完整数据集两部分,对完整数据集采用K-means算法进行聚类,然后将不完整数据依据设计的相似度度量方法划分到对应的簇中,实现数据集的聚类.实验结果表明,提出的方法能够高效、精确地实现不完整数据聚类.A large number of missing data exist in the process of data collection,which are called incomplete data.Traditional methods in clustering incomplete data use imputation or discarding strategy for data clustering. In thispaper,we propose a K-means clustering of incomplete data based on the incomplete information system theory. Thealgorithm firstly divides the data set into a complete data set and the incomplete data set,and using K- meansalgorithm for the complete data set clustering. Then the incomplete data are divided into the corresponding clustersbased on the design division of similarity measurement. Experiment demonstrates that the proposed algorithm cancluster the incomplete big data directly and improve the accuracy and effectivity.

关 键 词:不完整数据 K-MEANS聚类 不完整信息系统 

分 类 号:TP312[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象