多主题文本分类的实现算法  被引量:5

Algorithm for Multi-subject Text Classification

在线阅读下载全文

作  者:秦玉平[1] 王秀坤[1] 艾青[1] 刘卫江[1] 

机构地区:[1]大连理工大学电子与信息工程学院,渤海大学信息科学与工程学院,东南大学计算机科学与技术学科博士后流动站,大连116024,锦州121000,南京210096

出  处:《计算机工程》2008年第2期190-192,共3页Computer Engineering

基  金:国家“973”计划基金资助项目(2001CCA00700);国家自然科学基金资助项目(90104031)

摘  要:针对一个文本具有多主题属性,提出一种基于模糊支持向量机的多主题文本分类算法。用1-a-r方法训练子分类器,计算待分类文本到每个超平面的距离,依据距离得到隶属度向量,根据隶属度向量判定该文本所属的主题。实验结果表明,该算法在保证单主题文本分类精度的前提下,实现了多主题文本分类,并且有较好的准确率、召回率和F1值。For attribute of multi-subject of a text, a multi-subject text categortization algorithm based on fuzzy support vector machines is proposed. It uses "1-a-r" method to train sub-classifier. For the text to be classified, computing the distances from the text to every hyperplane, according to the distances, the membership vector is gotten, at last label the subjects that the text belongs to according to the membership vector. The experimental results show that the algorithm ensures classification precision of single-subject text, and realizes multi-subjects text classification, and has higher performance on precision recall and Fl value.

关 键 词:支持向量机 隶属度向量 召回率 准确率 F1值 

分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象