检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:蒋勇[1] 谭怀亮[2] 王祖析[1] 张朝霞[1]
机构地区:[1]湖南化工职业技术学院信息系,湖南株洲412004 [2]湖南大学计算机与通信学院,长沙410082
出 处:《计算机应用研究》2012年第6期2200-2204,共5页Application Research of Computers
基 金:国家教育部博士点基金资助项目(200805321029);湖南省自然科学基金资助项目(07JJ6139)
摘 要:为了改善单一聚类算法的聚类性能,提出一种基于量子遗传算法的XML文档聚类集成解决方法。该方法首先利用KNN分类算法将XML文档划分成k个差异性的聚类成员;其次根据聚类成员的关系获得内联相似度矩阵,并通过多次分割、向下、向上、双向收缩的QR算法分解特征值对应的特征向量来实现矩阵的维数缩减;然后在映射空间上用量子遗传算法实现聚类集成,把每一个样本判别到最优的聚类类别中。这样减少了数据差异性对聚类结果的影响,提高了聚类质量。实验结果表明,在真实的数据集上,该聚类集成算法比其他聚类集成算法具有更好的效果。To improve the clustering performance of a single clustering algorithm,this paper proposed an approach of the XML document clustering ensemble algorithm based on quantum genetic algorithm.Firstly,it divided the XML document into the difference of the k-members clustering using the K-nearest neighbour classifier algorithm.Next according to the relationship between the clustering members of the datasets was obtained Co-occurrence similarity matrix,and through a multi-segment and upward and downward double-direction shrink QR algorithm decomposition a large-scale matrix of eigenvalue to achieve the corresponding eigenvector matrix of dimensionality reduction.Finally in mapping space,using the quantum genetic algorithm to complete clustering ensemble,and discriminate the optimal clustering category from each sample.For to do it that would be reduced the data differences on the impact of clustering effects,and improved the clustering quality.Experiments on real-world data sets indicate that it has better clustering effects than clustering ensemble algorithms.
关 键 词:XML文档 KNN分类 量子遗传算法 聚类集成 聚类质量
分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.10