利用广义后缀树的最大相似度优先聚类方法  

Maximum Similarity Priority Clustering Method Based on Generalized Suffix Tree

在线阅读下载全文

作  者:蒋程 张建武[2] 

机构地区:[1]重庆数字城市科技有限公司,重庆400020 [2]中国联通重庆分公司,重庆401121

出  处:《中国科技信息》2013年第3期89-91,共3页China Science and Technology Information

基  金:重庆市科委(编号cstc2012gg-yyjsB40006)

摘  要:本文提出了利用后缀树模抽的最大相似度优先聚类方法,通过构造文档集的广义后缀树模型抽取短语作为特征项并映射到M维向量空间模型;计算文档间的相似度矩阵,对任意两个文档之间的相似度进行降序排列,优先合并具备最大相似度的文档对形成初始聚类;合并初始聚类得到最终聚类结果。A novel clustering method called Maximum Similarity Priority Clustering based on generalized suffix tree is proposed.Each phrase extracted from generalized suffix tree of documents collection is regarded as a unique feature term in vector space model.Similarities matrix is computed and the similarities are sorted in descend order.Then,according to maximum similarity priority,documents pairs are merged into initial clusters which can be merged into final clusters.

关 键 词:聚类方法 后缀树 最大相似度 向量空间模型 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象