基于KNN和SVM的中文文本自动分类研究被引量：10

Reseach on Automatic Classification for Chinese Text Based on KNN and SVM

出　　处：《情报科学》2011年第9期1313-1317,1377,共6页Information Science

基　　金：国家社会科学基金项目(09BTQ020)

摘　　要：借助文本分类系统软件,采用来自10个大类的中文文本数据,按照训练集与测试集2:1的比例,使用KNN和SVM分类算法,对数据集进行自动分类的实验。旨在通过具体的语料库实验,探讨文本自动分类的关键技术,分析、比较与评价实验结果,探讨文本分类中具体参数的设置和不同分类算法之优劣。This paper describes the experimental process of automatic text categorization. The experiment chooses Chinese text data sets from 10 categories,and distributes the training set and test set based on the ratio of 1：2. With the help of text automatic classification system software,the experiment does automatic classification based on algorithms of KNN and SVM,in order to compare different classification algorithms and explore key technologies of text classification.

关键词：自动分类 KNN SVM 中文信息处理

分类号：G350[文化科学—情报学]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于KNN和SVM的中文文本自动分类研究被引量：10

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于KNN和SVM的中文文本自动分类研究 被引量：10

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

基于KNN和SVM的中文文本自动分类研究被引量：10