一种改进的KNN文本分类  被引量:27

Improved KNN text categorization

在线阅读下载全文

作  者:钟将[1] 刘荣辉[1] 

机构地区:[1]重庆大学计算机学院,重庆400044

出  处:《计算机工程与应用》2012年第2期142-144,共3页Computer Engineering and Applications

基  金:国家自然科学基金重点项目(No.90818028);重庆市自然科学基金(No.2010BB2046);"211工程"三期建设项目(No.S-10218)

摘  要:在文本分类中,文本特征空间维数巨大以及训练样本分布不均衡等问题影响分类性能。针对这个问题,提出一种改进的KNN分类方法。利用隐含语义分析方法对特征样本空间进行降维处理;利用基于样本密度的改进的KNN分类器进行分类。实验结果表明提出的方法能够收到较好的分类效果。In text categorization,the problems of large feature dimension and samples data distributed imbalanced influence the classified results.To this problem,this paper puts forward an improved KNN method.Using latent semantic analysis to reduce dimensionality of text feature matrix.Using improved KNN method based on density to realize text categorization.The experimental results show that the proposed method can effectively improve the text categorization precision.

关 键 词:特征降维 潜在语义分析 K-最近邻法 文本分类 

分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象