有标记的文本聚类方法研究  被引量:1

A Method of Clustering with Marked Text

在线阅读下载全文

作  者:吴铁洲[1] 孙杨[1] 夏防震[1] 

机构地区:[1]湖北工业大学电气与电子工程学院,武汉430068

出  处:《舰船电子工程》2009年第4期104-106,132,共4页Ship Electronic Engineering

摘  要:聚类分析是一种模式识别无监督的分类方法。对于根据类别先验知识已经分类的文本,提出一种有标记的文本聚类分类方法。这种方法是在模糊聚类算法基础上进行了改进,通过有标记的文本样本,利用模糊聚类算法提取分类规则,然后用模糊推理方法进行分类的一种算法。文中讨论了此算法的具体数学模型,给出了算法流程。并通过实验验证了这种聚类方法是一种有效的文本分类手段。Clustering is a kind of pattern recognition and unsupervised classification. Based on the type of a priori knowledge of the classified version, this paper describes a method with the clustering in text categorization. This paper describes a method with the clustering in text categorization, which obtains the rule of marked text by fuzzy clustering algorithm and category by fuzzy reasoning methods. The paper discusses this specific mathematical model of the algorithm, and gives the algorithm process. Finally, an implementation of this algorithm is given, and the test on the dataset proves the validity of the algorithm.

关 键 词:聚类 模糊聚类算法 文本分类 有标记的文本 

分 类 号:TP391.4[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象