文本聚类中的特征选择方法  被引量:6

Way of Feature Selection Based on Text Clustering

在线阅读下载全文

作  者:龚静[1] 曾建一[1] 

机构地区:[1]湖南环境生物职业技术学院信息技术系,湖南衡阳421005

出  处:《吉首大学学报(自然科学版)》2008年第2期39-41,共3页Journal of Jishou University(Natural Sciences Edition)

基  金:湖南省教育厅科学研究项目(07D036)

摘  要:介绍了3种用于文本聚类的特征选择方法:文档频度、单词权、单词熵.用一个中文文本语料库对这3种特征选择方法进行了比较实验,实验结果表明在文本聚类中单词权的特征选择方法具有最好的选择结果.Three feature selection ways are presented for texts clustering:document frequency, term strength, entropybased feature ranking. A comparative experiment was conducted on the there ways by using a Chinese corpus. Results show that feature selection way of TS is the best choice for the results in text clustering.

关 键 词:特征选择 文本聚类 中文文本 

分 类 号:TP301[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象