一种基于TAN的文本分类方法  被引量:4

TEXT CLASSIFICATION BASED ON THE TAN MODEL

在线阅读下载全文

作  者:石洪波[1] 王志海[1] 黄厚宽[1] 

机构地区:[1]北方交通大学,计算机与信息技术学院,北京,100044

出  处:《广西师范大学学报(自然科学版)》2003年第1期81-85,共5页Journal of Guangxi Normal University:Natural Science Edition

基  金:铁道部科技研究项目

摘  要:提出了一种基于TAN模型的文本分类方法.朴素贝叶斯分类器是当前流行的一种文本分类算法,但是它的属性独立性假设使其无法表达文本词语之间的依赖关系.TAN(Tree Augmented Naive Bayes)是综合了朴素贝叶斯的简易性以及贝叶斯网表示依赖关系的能力,其分类性能可与当前流行的一些分类器相竞争.介绍了TAN模型,将其引入到文本分类中,并用实验比较了朴素贝叶斯和TAN,实验结果表明:该方法具有较好的分类性能.

关 键 词:文本分类 TAN模型 朴素贝叶斯分类器 贝叶斯网 特征选择 文本表示 文字信息处理 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象