检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]渤海大学工学院,辽宁锦州121013 [2]渤海大学数理学院,辽宁锦州121013 [3]渤海大学信息科学与技术学院,辽宁锦州121013
出 处:《渤海大学学报(自然科学版)》2017年第1期71-75,共5页Journal of Bohai University:Natural Science Edition
基 金:国家自然科学基金项目(No:61602056);辽宁省教育厅项目(No:L2014444)
摘 要:提出了一种组合凸线器和Hadamard纠错码相结合的多类文本分类算法,利用Hadamard纠错码将多类分类问题转换成多个二分类问题,对每个二分类问题,采用组合凸线器构造二分类器,使用海明距离判定待分类文本类别.在标准数据集Reuters 21578上进行了文本分类实验,分类结果表明,与支持向量机多类分类算法1-a-r、1-a-1和DAGSVM相比,该算法不仅提高了分类精度,而且分类速度有较大幅度的提高.A multi -class text classification algorithm based on Muhiconlitron and Hadamard ECOC is pro- posed. Hadamard ECOC is used to convert the multi - class classification problem into a series of binary - class problems. For each of the binary - class problems, the binary classifier is constructed by using multiconlitron. Hamming distance is used to determine the text category. The classification experiments are done on the reuters 21578 dataset. The experimental results show that, compared with 1 -a -r, 1 -a -1 and DAGSVM, the pro- posed algorithm can not only remarkably increase the speed of classification, but also significantly improve the precision of classification.
关 键 词:多类分类 组合凸线器 Hadamard纠错码
分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.173