中文文本分类系统的设计与实现  被引量:3

Design and Implementation of Chinese Text Categorization System

在线阅读下载全文

作  者:王俊英[1] 郭景峰[1] 霍峥[1] 

机构地区:[1]燕山大学信息科学与工程学院,河北秦皇岛066004

出  处:《微电子学与计算机》2006年第z1期262-265,共4页Microelectronics & Computer

摘  要:文章介绍了中文文本分类系统的基本过程及其关键技术,比较和分析Rocchio、朴素贝叶斯(NB)、kNN三种文本分类算法的分类原理,提出了中文文本分类系统的结构模型,并给出了评估方法和实验结果,测试结果表明KNN算法的分类效果最佳。This Paper introduces the techniques and basic process of Chinese text categorization system, compares and analyses the algorithms of Text Categorization, the theories and technologies such as Rocchio, NB, and kNN. It also describes a text categorization model of Chinese, and gives the evaluations and results. The experiment results have proved that classification results of kNN algorithms are best.

关 键 词:文本分类 向量空间模型 特征项选择 权重 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象