基于“中文新闻信息分类与代码”文本分类  被引量:5

Text Classification Based on Chinese News Information Classification and Code

在线阅读下载全文

作  者:张志平[1] 

机构地区:[1]北京语言大学应用语言研究所,北京100083

出  处:《太原理工大学学报》2010年第4期402-405,411,共5页Journal of Taiyuan University of Technology

基  金:国家自然科学基金项目(60663008);国家语言资源监测与研究中心平面媒体语言分中心项目:基于"中文新闻信息分类和代码"的分类语料库建设方法研究资助

摘  要:基于中文新闻信息分类体系,探索了中文新闻信息分类与代码的自动分类方法。根据中文新闻信息分类与代码的特点以及初始主题词满足的规则获得分类的初始主题词。Traditional classifying method for Chinese News Information Classification and Code is not suitable for text classification.In this paper,we research on automatic classification methods on the basis of Chinese News Information Classification and Code.According to characters of Chinese-language news classification and code and the rules for the initial topic words and phrases,the initial topic words and phrases are extracted with the help of information given by the classification system.The feature vector of Chinese News Information Classification and Code is constructed by the use of the initial topic words and phrases.The automatic text classification is implemented.the result is discussed by sampling analysis and the classification precision is 72%.

关 键 词:文本分类 中文新闻信息分类与代码 新闻文本 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象