一种新的兼类文本分类方法  被引量:1

New Multi-label Text Classification Algorithm

在线阅读下载全文

作  者:秦玉平[1] 陈一荻[1] 王春立[2] 王秀坤[3] 

机构地区:[1]渤海大学工学院,锦州121000 [2]大连海事大学信息科学技术学院,大连116026 [3]大连理工大学计算机科学与技术学院,大连116024

出  处:《计算机科学》2011年第11期204-205,224,共3页Computer Science

基  金:国家自然科学基金项目(60603023);国家基础研究重大项目(973)研究专项(2001CCA00700);辽宁省教育厅重点实验室项目(LS2010180)资助

摘  要:提出了一种基于超椭球的兼类文本分类算法。对每一类样本,在特征空间求得一个包围该类样本的最小超椭球,使得各类样本之间通过超椭球隔开。对待分类样本,通过判断其是否在超椭球内确定其类别。若没有超椭球包围待分类样本,则通过隶属度确定其所属类别。在标准数据集Reuters 21578上的实验结果表明,该方法较超球方法提高了分类精度和分类速度。A new multi-label text classification algorithm based on hyper ellipsoidal was proposed in this paper.For every class,the smallest hyper ellipsoidal that contains the samples of the class is structured,which can divide the class samples from others.For the sample to be classified,its class is confirmed by the hyper ellipsoidal that surrounds it.If the sample is not surrounded by any hyper ellipsoidal,the membership is used to confirmed its class.The experiments were done on Reuters 21578 and the experiment results show that the algorithm has a higher performance on classification speed and classification precision compare with hyper sphere algorithm.

关 键 词:超椭球 兼类分类 缩放因子 隶属度 

分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象