检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]铜仁学院计算机科学系,贵州铜仁554300 [2]贵州大学计算机科学系,贵州贵阳550025
出 处:《计算机应用与软件》2008年第2期250-252,277,共4页Computer Applications and Software
摘 要:对流数据进行有效聚类是一个吸引研究者很大注意力的问题。传统的聚类挖掘算法只能适用于纯数值属性数据或纯分类属性数据,很难适用于混合属性的数据。针对混合属性数据的特点,在借鉴AcluStream算法的基础上,提出了一种模糊聚类算法。算法对流数据的相异度分类度量,定量属性使用欧氏距离和曼哈坦距离度量,定性属性可以采用hamming距离度量。模糊聚类算法的主要步骤有两步:第一步,运用最小距离聚类算法进行聚类,构成一个初始类。第二步,对基于最小距离聚类算法进行聚类所得到的初始簇,运用密度聚类方法进行聚合或分割,使得聚类集合稳定。实践证明:该算法是快速地有效的。Effective clustering of streaming data is attractive to researchers. The traditional clustering excavation algorithm is only suitable for the data of cardinal number value attribute or the data of pure classified attribute, and it is not suitable for data of mixed attribute. Considering the characteristic of the data of mixed attribute, a fuzzy clustering algorithm is presented based on the AcluStream algorithm. The differentiation of the streaming data is classified and measured. The quota attribute is measured by Euclidean space & Kazak Tanzania, and the qualitative attribute is measured by hamming. The fuzzy clustering algorithm has two steps. Firstly, the minimum clustering algorithm is applied to constitute an initial cluster. Secondly ,the initial cluster is clustered and segmented by density clustering to make the cluster set stable. The practice proves that the algorithm is effective and fast.
分 类 号:TP274.2[自动化与计算机技术—检测技术与自动化装置] TP311[自动化与计算机技术—控制科学与工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.112