用于中文文本分类的基于类别区分词的特征选择方法  被引量:8

FEATURE SELECTION METHOD FOR CHINESE TEXT CATEGORISATION BASED ON CLASS DISCRIMINATING WORDS

在线阅读下载全文

作  者:周奇年[1] 张振浩[1] 徐登彩[1] 

机构地区:[1]浙江理工大学信息学院,浙江杭州310018

出  处:《计算机应用与软件》2013年第3期193-195,共3页Computer Applications and Software

摘  要:特征选择是中文文本分类过程中的一个重要过程,特征项选择的优劣直接影响文本分类的准确率。在分析几种特征选择方法的基础上,提出一种类别区分词的特征选择方法。实验结果表明,类别区分词的特征选择方法的分类效率高于传统方法,从而验证了该方法的有效性。Feature selection is a key process in Chinese text categorisation,which will directly affect the accuracy of text categorisation.After analysing some of the feature selection methods,a new feature selection method based on class-discriminating words is proposed.Experimental results show that the new feature selection method is superior to traditional approaches in categorisation efficiency,therefore verifies the validity of the new method.

关 键 词:文本分类 特征选择 类别区分词 信息增益 互信息 期望交叉熵 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象