基于向量空间模型的文本自动分类系统的研究与实现  被引量:13

Research and Implementation of Automatic Text Categorization System Based on VSM

在线阅读下载全文

作  者:武旭[1] 须德[1] 

机构地区:[1]北方交通大学计算机与信息技术学院,北京100044

出  处:《北方交通大学学报》2003年第2期38-41,共4页Journal of Northern Jiaotong University

摘  要:分析了文本自动分类的关键理论及技术,给出一个已实现的基于向量空间模型(VSM)的文本自动分类系统的框架模型,重点描述此系统的实现算法.此算法在训练阶段通过部分训练集确定向量的特征提取维数,并提出一种"平均值"匹配阈值调整方法,从而在精度和效率方面优于传统的分类算法.实验表明此系统查准率为91.8%,查全率为85%.This paper firstly gives a research to several key techniques about Text Categorization, and then provides the architecture of an implemented Automatic Text Categorization System Based on VSM, focusing on its implementation algorithms which determine the vector feature selection dimension via test set in training process and provide an 'Average' matching_threshold adjustment method. Thus it outperforms the traditional classification algorithms in precision and speed. Finally, the evaluations and test results are presented in this paper.

关 键 词:文本分类 向量空间模型 特征提取 

分 类 号:TP274.3[自动化与计算机技术—检测技术与自动化装置]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象