一种改进的贝叶斯文本分类模型  

The Improvement of Nave Bayes Text Classifier

在线阅读下载全文

作  者:王潇[1] 胡鑫[1] 

机构地区:[1]西北师范大学数学与信息科学学院,甘肃兰州730070

出  处:《邢台职业技术学院学报》2006年第1期19-21,共3页Journal of Xingtai Polytechnic College

摘  要:朴素贝叶斯文本分类模型是一种简单而高效的文本分类模型,但是它的独立性假设属性使其无法表示现实世界属性之间的依赖关系,从而影响它的分类性能。这里提出一种改进的基于贝叶斯定理的文本分类模型——“树桩网络(Stump Network)”,并将该方法与朴素贝叶斯文本分类器和TAN(Tree Augmented Naive Bayes)文本分类器进行实验比较,结果表明,在大多数数据集上该文本分类方法具有较高的分类正确率。Naive Bayes text classifier is a simple and effective text classification method, but its attribute independence assumption makes it unable to express the dependence among attribute in the real world, and affects its classification performance. In this paper, an improved text classification model based on Bayes theorem called Stump Network is presented. Stump Network text classifier is compared with Naive Bayes text classifier and TAN (tree augmented naive Bayes) by an experiment. Experimental results show this model has higher classification accuracy in most data sets.

关 键 词:文本分类 树桩网络 朴素贝叶斯 TAN 

分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象