数字图书馆文本分类特征提取方法研究与改进  

Research and Improvement of Feature Selection for Page Categorization in Digital Library

在线阅读下载全文

作  者:鲍凌云[1] 

机构地区:[1]菏泽学院图书馆,山东菏泽274015

出  处:《农业图书情报学刊》2014年第7期33-35,共3页Journal of Library and Information Sciences in Agriculture

基  金:菏泽学院人文社会科学研究项目"社交网络SNS在高校图书馆服务中的应用研究"(项目编号:XY12SK07)

摘  要:从数字图书馆应用文本分类的重要性入手,介绍了文本分类的含义及基本技术,重点分析了文本分类中常用的两种特征提取方法:互信息算法和χ2统计量算法,指出两种算法存在的不足并提出相应的改进措施。Firstly this paper analyzed the importance of applying page categorization in digital library,then it introduced the connation and basic technologies of page categorization.Also the author studied two main feature selection methods specially:Mutual Information algorithm and Chi-square algorithm.Meanwhile,the paper pointed the current weaknesses of the two feature selection methods and put forward corresponding improving measures.

关 键 词:文本分类 特征提取 互信息算法 χ2统计量算法 

分 类 号:G250[文化科学—图书馆学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象