基于支持向量机的文本自动分类试验研究

Study on Automatic Text Categorization with Support Vector Machine

作　　者：施洁斌[1]

出　　处：《现代图书情报技术》2004年第7期27-29,67,共4页New Technology of Library and Information Service

摘　　要：提出了将支持向量机应用于文本自动分类的研究 ,与常用的 K-最邻近法相比 ,无论是对训练数据集还是测试数据集均具有一定的优势 ,而且不同特征选择方法对支持向量机的影响要比 K-最邻近法小。此外 ,从研究中的不同特征选择的评价函数来看 ,它们对分类有一定的影响 ,应用 X2统计进行特征选择的分类正确率最高 ,其次是文本证据权 ,而期望交叉熵的效果最差 ,说明特征选择在文本自动分类中也是相当重要的。A new machine learning method of Support Vector Machine (SVM), is applied in automatic text categorization. Comparing with the result achieved by k-nearest neighbor algorithm, the accuracy achieved by support vector machine is better; The effect of feature selection methods is smaller to SVM than the KNN method. The SVM is a potential and competitive method for automatic text categorization. The feature selection methods also affectes the accuracy of text categorization.

关键词：文本自动分类支持向量机 K-最邻近法特征选择

分类号：G353.1[文化科学—情报学]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于支持向量机的文本自动分类试验研究

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于支持向量机的文本自动分类试验研究

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索