检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:张志平[1]
机构地区:[1]北京语言大学应用语言研究所,北京100083
出 处:《太原理工大学学报》2010年第4期402-405,411,共5页Journal of Taiyuan University of Technology
基 金:国家自然科学基金项目(60663008);国家语言资源监测与研究中心平面媒体语言分中心项目:基于"中文新闻信息分类和代码"的分类语料库建设方法研究资助
摘 要:基于中文新闻信息分类体系,探索了中文新闻信息分类与代码的自动分类方法。根据中文新闻信息分类与代码的特点以及初始主题词满足的规则获得分类的初始主题词。Traditional classifying method for Chinese News Information Classification and Code is not suitable for text classification.In this paper,we research on automatic classification methods on the basis of Chinese News Information Classification and Code.According to characters of Chinese-language news classification and code and the rules for the initial topic words and phrases,the initial topic words and phrases are extracted with the help of information given by the classification system.The feature vector of Chinese News Information Classification and Code is constructed by the use of the initial topic words and phrases.The automatic text classification is implemented.the result is discussed by sampling analysis and the classification precision is 72%.
关 键 词:文本分类 中文新闻信息分类与代码 新闻文本
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.28