一种基于特征投票的文本分类方法  被引量:1

Text Categorization Method Based on Features Vote

在线阅读下载全文

作  者:焦庆争[1,2] 蔚承建[1] 

机构地区:[1]南京工业大学信息科学与工程学院,南京210009 [2]安徽师范大学信息管理中心,芜湖241000

出  处:《计算机工程》2010年第9期200-202,共3页Computer Engineering

基  金:国家自然科学基金资助项目(60703071);安徽省高校省级自然科学研究基金资助重点项目(KJ2009A63)

摘  要:基于特征投票机制设计一种线性文本分类方法,运用信任机制理论分析文档类别对特征的信任关系,给出具体特征信任度的模型,并在Newsgroup、复旦中文分类语料、Reuters-21578 3个广泛使用且具有不同特性的语料集上与传统方法进行比较。实验结果表明,该方法分类性能优于传统方法且稳定、高效,适用于大规模文本分类任务。This paper discusses a text categorization approach based on features vote,which is linear as well as high efficient.It uses the trust mechanism theory to analyze the trust relation between features and document classes,and gives the model to calculate the trust values.In the comparison experiments,Newsgroup,Fudan Chinese evaluation data collection and Reuters-21578 are used to evaluate the effectiveness of the techniques.Experimental results show the method can improve the performance for text categorization,and is suitable for large-scale text categorization.

关 键 词:文本分类 特征投票 经验概率 自然语言处理 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象