一种基于GN算法的文本概念聚类新方法  被引量:7

New method for text concept clustering based on GN algorithm

在线阅读下载全文

作  者:安娜[1] 谢福鼎[1] 张永[1] 刘绍海[1] 

机构地区:[1]辽宁师范大学计算机与信息技术学院,辽宁大连116029

出  处:《计算机工程与应用》2008年第14期142-144,180,共4页Computer Engineering and Applications

基  金:国家自然科学基金(the National Natural Science Foundation of China under Grant No.10771092);国家重点基础研究发展规划(973)(the National Grand Fundamental Research973Program of China under Grant No.2004CB318000)

摘  要:文本聚类是当前文本信息挖掘的基础和研究的重点。给出一种新的文本聚类方法,它将概念格和复杂网络有机地结合起来,以达到更优的聚类效果。首先计算关键词特征权值并对特征向量进行降维处理,然后根据关键词权值大小映射到形式背景中,通过本文所给出的新的相似度公式,计算出形式背景中概念相似度的大小,从而构造GN网络并应用GN算法进行文本概念聚类。最后通过实例,验证了方法的可行性。Text clustering is a basic and important topic in text mining. This paper presents a new text clustering method which takes the advantages of concept lattice and complex network. The algorithm firstly computes the weights of the key words and processes the problem of decreasing dimension,and then the formal context is constructed in terms of key words which have the proper weight. Secondly, the similarities between concepts are computed by using of the formula proposed in this paper. Text concept clustering can be done by the construction of GN network and application of GN algorithms. At last,the experiment shows the validity of this method.

关 键 词:复杂网络 GN算法 文本聚类 概念格 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象