组合凸线器和Hadamard纠错码相结合的多类文本分类算法  被引量:1

A Multi-class classification algorithm based on multiconlitron and hadamard ECOC

在线阅读下载全文

作  者:秦玉平[1] 邱凤凤 冷强奎[3] 

机构地区:[1]渤海大学工学院,辽宁锦州121013 [2]渤海大学数理学院,辽宁锦州121013 [3]渤海大学信息科学与技术学院,辽宁锦州121013

出  处:《渤海大学学报(自然科学版)》2017年第1期71-75,共5页Journal of Bohai University:Natural Science Edition

基  金:国家自然科学基金项目(No:61602056);辽宁省教育厅项目(No:L2014444)

摘  要:提出了一种组合凸线器和Hadamard纠错码相结合的多类文本分类算法,利用Hadamard纠错码将多类分类问题转换成多个二分类问题,对每个二分类问题,采用组合凸线器构造二分类器,使用海明距离判定待分类文本类别.在标准数据集Reuters 21578上进行了文本分类实验,分类结果表明,与支持向量机多类分类算法1-a-r、1-a-1和DAGSVM相比,该算法不仅提高了分类精度,而且分类速度有较大幅度的提高.A multi -class text classification algorithm based on Muhiconlitron and Hadamard ECOC is pro- posed. Hadamard ECOC is used to convert the multi - class classification problem into a series of binary - class problems. For each of the binary - class problems, the binary classifier is constructed by using multiconlitron. Hamming distance is used to determine the text category. The classification experiments are done on the reuters 21578 dataset. The experimental results show that, compared with 1 -a -r, 1 -a -1 and DAGSVM, the pro- posed algorithm can not only remarkably increase the speed of classification, but also significantly improve the precision of classification.

关 键 词:多类分类 组合凸线器 Hadamard纠错码 

分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象