基于SVM与KNN的中文文本分类比较实证研究  被引量:10

Empirical Study of the Comparison of SVM and KNN-based Categorization of Chinese Text

在线阅读下载全文

作  者:刘怀亮[1] 张治国[1] 马志辉[1] 孙蕾[1] 

机构地区:[1]西安电子科技大学经济管理学院,陕西西安710071

出  处:《情报理论与实践》2008年第6期941-944,共4页Information Studies:Theory & Application

基  金:国家自然科学基金资助项目"基于语义网的多媒体检索与数据挖掘"(项目编号:70503022);中国博士后基金项目"基于支持向量机的视频语义检索研究"(项目编号:20060400996)的研究成果之一

摘  要:本文详细介绍了中文文本分类过程以及SVM和KNN两种方法在中文文本分类中的具体步骤,给出了中文文本分类的模型。通过实验对SVM算法和传统的KNN算法应用于文本分类效果进行了比较性实证研究。研究表明,SVM分类器较KNN在处理中文文本分类问题上有更良好的分类效果,有较高的查全率和查准率。After describing the categorization process of the Chinese text and the concrete steps of using SVM and KNN to categorize the Chinese text,a model of Chinese text categorization is proposed.An empirical study of using the SVM algorithm and the traditional KNN algorithm to categorize the Chinese text is conducted.The experiment shows that,compared with KNN,SVM has better categorization effect of the Chinese text and higher recall ratio and pertinency ratio.

关 键 词:支持向量机 文本分类 实证研究 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象