检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:谢凤宏[1] 张大为[1] 黄丹[1] 谢福鼎[1]
机构地区:[1]辽宁师范大学计算机与信息技术学院,辽宁大连116081
出 处:《计算机工程与设计》2011年第3期1059-1061,1078,共4页Computer Engineering and Design
基 金:国家自然科学基金项目(10771092)
摘 要:文本聚类是文本挖掘的一种重要方法,提出了一种加权复杂网络社团划分的新算法,通过不断寻找复杂网络中的稠密集并对其进行适当操作,达到了划分加权复杂网络的目的。将该算法应用于文本聚类,将文本用向量空间模型表示,用余弦公式计算文本之间的相似度,根据邻居节点构造出加权复杂网络,用提出的算法对加权复杂网络进行社团划分。对Reu-ters-21578数据集中的部分样本进行聚类,实验结果表明了该方法具有良好的聚类效果。Text clustering is an important method for text mining.Firstly,a new algorithm for detecting community structures in a weighted complex network is proposed.To partition the weighted complex network into groups,the algorithm looks for the density sets constantly and some proper operations are executed.Secondly,the proposal is applied to cluster text documents which are represented by using the vector space model.A weighted complex network is constructed in terms of the similarity between two documents calculated by the cosine function.And then the community structure in this network is detected by the proposed algorithm.Finally,the experiment results show that the proposed algorithm has a good clustering efficiency by clustering some samples of Reuters-21578 data sets.
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.147