基于命名实体的Web新闻文本分类方法  被引量:5

Text categorization of Web news based on named entity

在线阅读下载全文

作  者:潘正高[1,2] 侯传宇[2] 谈成访[2] 

机构地区:[1]合肥工业大学计算机与信息学院,安徽合肥230009 [2]宿州学院智能信息处理重点实验室,安徽宿州234000

出  处:《合肥工业大学学报(自然科学版)》2011年第8期1178-1182,共5页Journal of Hefei University of Technology:Natural Science

基  金:安徽省高校优秀青年人才基金资助项目(2010SQRL193);宿州学院自然科学研究基金资助项目(2008yzk04);宿州学院硕士科研启动基金资助项目(2009YSS12);宿州学院科研开放平台课题(2011ykf10)

摘  要:文章对Web新闻领域的文本自动分类问题进行了研究,提出一种基于新闻实体要素的分类方法;在应用空间向量模型的基础上,充分考虑命名实体对Web新闻文本分类的特殊作用,并进行了实验。实验结果表明,以新闻实体要素为特征的文本分类系统可得到较高的分类精度,该方法具有一定的实用价值。In this paper,the method of automatic text categorization of Web news is researched,and a categorization method based on the named entity of news is proposed.The special effect of the named entity on the text categorization of Web news is analyzed by applying the vector space model(VSM) and an experiment is carried out.The experimental result shows that the presented method has better precision of text categorization and can perform well.

关 键 词:文本分类 向量空间模型 特征选择 命名实体 

分 类 号:TP391.12[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象