检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]渤海大学信息科学与技术学院,辽宁锦州121000 [2]大连理工大学软件学院,辽宁大连116620
出 处:《河南科学》2014年第11期2259-2262,共4页Henan Science
基 金:辽宁省自然科学基金(2013020014);中国高等职业技术教育研究会规划课题(GZYGH1213036;GZYGH1213035);省社科联2014年度辽宁经济社会发展立项课题(20141slktzijy-08)
摘 要:数据采集过程中存在大量缺失数据,即不完整数据.传统方法在聚类不完整数据时采用填充或丢弃缺失数据方式实现数据的聚类.依据不完整信息系统理论提出一种基于K-means的不完整数据聚类算法,算法首先将数据集划分成完整数据集和非完整数据集两部分,对完整数据集采用K-means算法进行聚类,然后将不完整数据依据设计的相似度度量方法划分到对应的簇中,实现数据集的聚类.实验结果表明,提出的方法能够高效、精确地实现不完整数据聚类.A large number of missing data exist in the process of data collection,which are called incomplete data.Traditional methods in clustering incomplete data use imputation or discarding strategy for data clustering. In thispaper,we propose a K-means clustering of incomplete data based on the incomplete information system theory. Thealgorithm firstly divides the data set into a complete data set and the incomplete data set,and using K- meansalgorithm for the complete data set clustering. Then the incomplete data are divided into the corresponding clustersbased on the design division of similarity measurement. Experiment demonstrates that the proposed algorithm cancluster the incomplete big data directly and improve the accuracy and effectivity.
分 类 号:TP312[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.14.72.80