新型快速中文文本分类器的设计与实现  被引量:5

Design and implementation of new Chinese text classier

在线阅读下载全文

作  者:陈艳秋[1] 熊耀华[1] 

机构地区:[1]东北大学东软信息技术学院计算机科学与技术系,辽宁大连100623

出  处:《计算机工程与应用》2009年第22期53-55,共3页Computer Engineering and Applications

摘  要:为了提高中文文本分类的效率与精度,设计了一种新型的分类器。该分类器采用基于词频、互信息和类别信息的综合评估函数进行选择特征;在特征权重计算上,由于传统TF-IDF方法没有考虑特征类间和类内分布,提出了一种将词频和综合评估函数值相结合的权重计算方法;最后设计了一种基于贝叶斯原理的快速分类器。实验证明该分类器简单有效。For improving the efficiency and accuracy of Chinese text categorization,this paper presents a new Chinese text classier,in which a novel feature selection is proposed according to word frequency,mutual information and classificatory information,and after analyzing the hypostasis of the traditional TF-IDF,a weight adjustment method is put forward in which the IDF function is replaced by function used in feature selection.Finally a fast Bayes theory classier is designed.Experiments prove this classier is simple and effective.

关 键 词:中文文本分类 特征选择 特征权重 分类算法 

分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象