基于朴素贝叶斯分类器的朝鲜语文本分类的研究  被引量:13

Research on Korean Text Categorization Based on Naive Bayesian Classifier

在线阅读下载全文

作  者:周国强[1] 崔荣一[1] 

机构地区:[1]延边大学计算机科学与技术学科智能信息处理研究室,吉林延吉133002

出  处:《中文信息学报》2011年第4期16-19,共4页Journal of Chinese Information Processing

基  金:国家自然科学基金资助项目(69362001)

摘  要:该文基于朴素贝叶斯分类器对朝鲜语文本分类进行了研究。首先,利用基于类别选择的特征选择方法对朝鲜语文本进行特征选择,并使用类TF-IDF估算方法计算权重;其次,构造朴素贝叶斯分类器;最后,利用分类器实现对朝鲜语文本的分类。实验表明,该方法在朝鲜语文本分类中具有较好的效果,为朝汉结合文本分类提供了一定的依据。Korean text categorization based on na ve bayesian classifier is studied in this paper.Firstly,features are selected by the category selection method,and weights are calculated by estimation method as TF-IDF;Secondly,the naive bayesian classifier is established;Finally,the classifier is applied to Korean text categorization.The experiment results show that the method has good performance on Korean text classification,and it provides certain basis for the classification of text with both Korean and Chinese.

关 键 词:朝鲜语 朴素贝叶斯 文本分类 TF-IDF 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象