基于DF算法改进的文本聚类特征选择算法  被引量:6

Improved Feature Selection Algorithm based on DF Algorithm for Text Clustering

在线阅读下载全文

作  者:樊东辉[1,2] 王治和[1] 陈建华[1] 许虎寅[1] 

机构地区:[1]西北师范大学数学与信息科学学院,甘肃兰州730070 [2]河南驻马店职业技术学院,河南驻马店463000

出  处:《甘肃联合大学学报(自然科学版)》2012年第1期51-54,共4页Journal of Gansu Lianhe University :Natural Sciences

摘  要:通过研究文本特征选取中权重的计算问题,提出了一种利用特征词的熵函数加权的权值的计算方法,不但考察了特征词的文档频数,而且考察了它们在文档中出现的次数,使选出的特征子集更具有较好的代表性.实验表明,改进后的算法对聚类结果有了一定的改进.By studying the text feature selection in the weight calculation problem,a calculation method of the word entropy weighted was proposed.Not only examines the characteristics of the document frequency,but also examines them in a document the number of occurrences.This selected feature subset is more good representation.Experiments show that the improved algorithm for clustering results have certain improvements.

关 键 词:特征选择 文档频 词频 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象