基于互信息的文本特征选择方法研究与改进  被引量:23

Study and improvement of mutual information based text feature selection method

在线阅读下载全文

作  者:刘健[1] 张维明[1] 

机构地区:[1]国防科技大学信息系统与管理学院,长沙410073

出  处:《计算机工程与应用》2008年第10期135-137,共3页Computer Engineering and Applications

基  金:国家自然科学基金(the National Natural Science Foundation of China under Grant No.70371008)

摘  要:通过对互信息(MI)文本特征选择方法与信息增益、卡方统计方法的实验研究比较,发现了影响MI方法性能的主要因素是特征选择过程中的随机性,通过加入扰动因子的方法对MI方法进行了改进,消除了随机性的影响,实验表明,改进后的MI方法与信息增益、卡方统计方法比较,具有较明显的优势。A study on the contrast of text selection methods based on mutual information,information gain and CHI has been taken in this paper,find the main factor restrains the performance of MI method is randomicity,an improvement is proposed.The experiment shows that the improved method has good performance and is better than IG and CHI method.

关 键 词:互信息 信息增益 CHI 文本分类 特征选择 

分 类 号:TP14[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象