一种基于特征加权的KNN文本分类算法  被引量:4

A KNN Algorithm in Text Classification Based on Feature Weighting

在线阅读下载全文

作  者:赵俊杰[1] 盛剑锋[1] 陶新民 

机构地区:[1]安徽财经大学,讲师安徽蚌埠233000 [2]哈尔滨工程大学,副教授黑龙江哈尔滨150001

出  处:《电脑学习》2010年第2期84-86,共3页Computer Study

基  金:教育部社科研究基金青年项目(07JC870006);安徽省哲学社会科学规划项目基金(AHSKF07-08D03);安徽财经大学教研重点项目(ACJYZD200914)

摘  要:KNN文本分类算法是一种简单、有效、非参数的分类方法。针对传统的KNN文本分类算法的不足,出现了很多改进的KNN算法。但改进的KNN分类算法大多数是建立在样本选择的基础上。即以损失分类精度换取分类速度。针对传统的KNN文本分类算法的不足,提出一种基于特征加权的KNN文本分类算法(KNNFW),该算法考虑各维特征对模式分类贡献的不同,给不同的特征赋予不同的权值,提高重要特征的作用,从而提高了算法的分类精度。最后给出实验结果并对实验数据进行分析得出结论。KNN classification algorithm is a simple and effective method of classification.According to the deficiencies of traditional KNN,there appear a lot of improved KNN algorithms,but most improved KNN classification algorithm is based on the sample selection,namely,loss of classification accuracy for classification rate.According to the deficiencies of traditonal KNN algorithm,a KNN algorithm basd on feature weighting(KNNFW)is proposed in this paper.the a-lgorithm considers different contributions of the fractal features to the pattern classification,gives different weight to different characteristics,improves the important role of the features,so as to improve the accuracy of classification algorithm.The experimental results are presented and the experimental data analysis conclusion is also achieved.

关 键 词:特征加权 K最近邻 文本分类 特征选取 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象