基于TAN的文本自动分类框架  被引量:1

Automatic Text Categorization Framework Based on TAN

在线阅读下载全文

作  者:刘佳[1] 贾彩燕[1] 

机构地区:[1]北京交通大学计算机与信息技术学院,北京100044

出  处:《计算机工程》2010年第16期36-38,41,共4页Computer Engineering

基  金:高等学校博士学科点专项科研基金资助项目(2007004038)

摘  要:介绍一种树状朴素贝叶斯(TAN)文本分类模型,对该模型存在的阈值选取问题进行实验分析,提出不需要进行阈值选取的TAN文本自动分类框架(ATAN)。在中英文非均匀类分布测试集上对基于ATAN的2种算法与手动选取阈值达到最优性能的BL-TAN进行对比,结果表明基于ATAN的算法具有更高性能。This paper introduces a Tree-Augmented Na?ve Bayes(TAN) text categorization model,analyzes its problem of threshold selection,and proposes an Automatic TAN(ATAN) text categorization framework.Two algorithms based on ATAN are compared to the BL-TAN with the best classification performance at a specified threshold both on Chinese and English imbalanced datasets.Results show that algorithms based on ATAN have higher performance than BL-TAN.

关 键 词:文本分类 树状朴素贝叶斯模型 贝叶斯网络 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象