基于支持向量机的文本自动分类试验研究  

Study on Automatic Text Categorization with Support Vector Machine

在线阅读下载全文

作  者:施洁斌[1] 

机构地区:[1]浙江大学图书馆,杭州310029

出  处:《现代图书情报技术》2004年第7期27-29,67,共4页New Technology of Library and Information Service

摘  要:提出了将支持向量机应用于文本自动分类的研究 ,与常用的 K-最邻近法相比 ,无论是对训练数据集还是测试数据集均具有一定的优势 ,而且不同特征选择方法对支持向量机的影响要比 K-最邻近法小。此外 ,从研究中的不同特征选择的评价函数来看 ,它们对分类有一定的影响 ,应用 X2统计进行特征选择的分类正确率最高 ,其次是文本证据权 ,而期望交叉熵的效果最差 ,说明特征选择在文本自动分类中也是相当重要的。A new machine learning method of Support Vector Machine (SVM), is applied in automatic text categorization. Comparing with the result achieved by k-nearest neighbor algorithm, the accuracy achieved by support vector machine is better; The effect of feature selection methods is smaller to SVM than the KNN method. The SVM is a potential and competitive method for automatic text categorization. The feature selection methods also affectes the accuracy of text categorization.

关 键 词:文本自动分类 支持向量机 K-最邻近法 特征选择 

分 类 号:G353.1[文化科学—情报学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象