文本挖掘中的层次聚类算法  被引量:1

Hierarchical Clustering Algorithm in Text Mining

在线阅读下载全文

作  者:谢坤武[1] 

机构地区:[1]湖北民族学院信息工程学院,湖北恩施445000

出  处:《湖北民族学院学报(自然科学版)》2009年第4期415-419,共5页Journal of Hubei Minzu University(Natural Science Edition)

基  金:湖北省科技攻关项目(2004AA210B01)

摘  要:随着互联网中信息的日益增长,通过文本挖掘,快速、准确地检索信息和分类信息成为人们日益迫切的要求,具有广泛的应用前景和实用价值.依据信息论的思想,从文档信息量变化的角度,对文本数据从概率角度来研究文本数据的聚类分析,研究信息量在层次聚类过程中所呈现的规律性,进而提出一种基于信息量模型的聚类分析算法.With the growing information on the Internet,rapid and accurate retrieval and classification of information through text mining has become increasingly important,and it has a wide application prospect and practical value.This paper,based on information theory,studies the clustering of text data according to change of information amount of the document and the rule of information amount in the process of hierarchical clustering,and presents a clustering algorithm based on the information amount model.

关 键 词:文本挖掘 层次聚类 信息熵 关联特征 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象