文本分类中基于类别概念的特征选择方法  被引量:4

A New Feature Selection Method Based on Class-Concept in Text Categorization

在线阅读下载全文

作  者:杨奋强[1] 刘玉贵[1] 

机构地区:[1]中国科学院研究生院信息科学与工程学院,北京100049

出  处:《计算机系统应用》2009年第10期93-96,共4页Computer Systems & Applications

基  金:国家自然科学基金(69983007)

摘  要:传统的TFIDF公式常被用于信息检索各种计算特征项权重的场合,但在文本分类任务下,TFIDF忽略了特征项的类别信息,且较易产生一些不合理的低频高权特征,一定程度上影响了最终分类的准确性。本文提出一种基于类别概念的TFCW特征选择方法,该方法避免了TFIDF的上述缺陷。实验表明该方法用于文本分类中优于目前常见的TFIDF改进算法。

关 键 词:文本分类 特征选择 TFCW 类别 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象