检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]辽宁师范大学计算机与信息技术学院,辽宁大连116029
出 处:《计算机工程与应用》2008年第14期142-144,180,共4页Computer Engineering and Applications
基 金:国家自然科学基金(the National Natural Science Foundation of China under Grant No.10771092);国家重点基础研究发展规划(973)(the National Grand Fundamental Research973Program of China under Grant No.2004CB318000)
摘 要:文本聚类是当前文本信息挖掘的基础和研究的重点。给出一种新的文本聚类方法,它将概念格和复杂网络有机地结合起来,以达到更优的聚类效果。首先计算关键词特征权值并对特征向量进行降维处理,然后根据关键词权值大小映射到形式背景中,通过本文所给出的新的相似度公式,计算出形式背景中概念相似度的大小,从而构造GN网络并应用GN算法进行文本概念聚类。最后通过实例,验证了方法的可行性。Text clustering is a basic and important topic in text mining. This paper presents a new text clustering method which takes the advantages of concept lattice and complex network. The algorithm firstly computes the weights of the key words and processes the problem of decreasing dimension,and then the formal context is constructed in terms of key words which have the proper weight. Secondly, the similarities between concepts are computed by using of the formula proposed in this paper. Text concept clustering can be done by the construction of GN network and application of GN algorithms. At last,the experiment shows the validity of this method.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.229