一种基于改进互信息的文本分类方法  被引量:4

Based on a Kind of Method to Categorize Text of Improve the Mutual Information

在线阅读下载全文

作  者:裴志利[1] 李志刚[2] 王建[3] 孔英[3] 梁艳春[4] 卢弈南[4] 

机构地区:[1]内蒙古民族大学数学与计算机科学学院,内蒙古通辽028043 [2]吉林省统计局计算中心,吉林长春130051 [3]大连医科大学,辽宁大连116023 [4]吉林大学计算机科学与技术学院,吉林长春130012

出  处:《内蒙古民族大学学报(自然科学版)》2007年第4期377-380,共4页Journal of Inner Mongolia Minzu University:Natural Sciences

基  金:国家自然科学基金重点项目(60433020);国家自然科学基金项目(30400162);吉林省科学技术发展项目(20050705-2);国家教育部博士基金项目(20030183060);吉林大学"985"项目

摘  要:用改进的互信息公式进行特征选择,通过三种文本分类方法验证了改进的公式具有较高的准确率、召回率和F1值,从而证明改进的互信息公式的有效性. Feature selection is done according to improved mutual information formats that is verified to have superior accuracy rate,recall rate and F1 value through three kinds of methods to categorize text,thereby the validity of improved mutual information formats is verified.

关 键 词:文本分类 特征选择 互信息 F1值 

分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象