面向新闻领域的中文文本分类研究综述  被引量:25

Research Review on Chinese Text Classification in the News Field

在线阅读下载全文

作  者:薛春香[1] 张玉芳[1] 

机构地区:[1]南京理工大学信息管理系

出  处:《图书情报工作》2013年第14期134-139,共6页Library and Information Service

基  金:江苏省社会科学基金项目"数字报纸的自动标引研究"(项目编号:09TQC011);教育部人文社会科学研究项目"电子报纸内容深加工研究"(项目编号:09YJC870014)研究成果之一

摘  要:在对文本分类及中文新闻分类概述的基础上,归纳出网络新闻文本特征及当前新闻文本分类特点,并总结新闻文本分类在新闻网站分类导航、话题识别与跟踪、个性化推荐三方面的应用。其后,总结中文新闻分类存在的问题,诸如缺乏通用语料和评价方法、分类体系粗略、分类维度单一等,并提出相应措施。最后,针对当前信息环境,提出新闻分类不仅将朝着多层次、多维度、跨语言方向发展,还将与多媒体信息、大数据、社会化媒体相结合。Based on the review of text classification and news categorization, the features of news text and the characteristics of news categorization are concluded. The applications of Chinese news categorization on news site navigation, topic detection and tracking, and personalized news recommendation are summarized. Finally, this paper puts forward corresponding measures to solve existing problems about Chinese news categorization, such as low authenticity of news, idealization of classification system, and single dimension of classification.

关 键 词:新闻分类 文本分类 机器学习 中文信息处理 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象