一种改进的特征选取方法  

在线阅读下载全文

作  者:苑俊英[1] 陈海山[2] 

机构地区:[1]中山大学南方学院 [2]中山大学信息科学与技术学院

出  处:《科技信息》2009年第4期172-173,共2页Science & Technology Information

摘  要:从人工分类的角度看,标题、摘要及关键词中的词条对于文本分类具有更重要的作用,在特征选取中低DF值的词条可能更能代表文本的类别信息。针对以上两个问题,本文提出了基于类别核心词的特征选取方法。首先,从标题、摘要及关键词中提取类别核心词;然后,通过加权方式,强化它们在特征选取中的作用;最后在朴素贝叶斯分类方法上进行实验。实验结果表明,提出的方法能够有效提高中文文本的分类准确率。

关 键 词:特征选取 类别核心词 朴素贝叶斯 文本分类 

分 类 号:TP18[自动化与计算机技术—控制理论与控制工程] TS972.23[自动化与计算机技术—控制科学与工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象