检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:李校林[1,2,3] 王成 LI Xiao-lin;WANG Cheng(College of Communication and Information Engineering,Chongqing University of Posts and Telecommunications,Chongqing 400065;Research Center of New Telecommunication Technology Applications,Chongqing University of Posts and Telecommunications,Chongqing 400065;Chongqing Information Technology Designing Limited Company,Chongqing 400021,China)
机构地区:[1]重庆邮电大学通信与信息工程学院,重庆400065 [2]重庆邮电大学通信新技术应用研究中心,重庆400065 [3]重庆信科设计有限公司,重庆400021
出 处:《计算机工程与科学》2020年第6期1120-1126,共7页Computer Engineering & Science
摘 要:为了解决目前所提出的多标签分类算法仍然存在分类精度低和计算复杂度高的问题,提出了一种基于质心的多标签引力模型(ML-GM)。在训练阶段,通过计算文档与类的质心之间的相似性来获得相似性区间。在测试阶段,通过比较未定义文档和类质心之间的相似性是否在相似性区间内来进行多标签分类。该模型通过引入质心分类器和引力模型(GM)解决了计算复杂度高、分类精度低的问题。在实验中使用了雅虎数据集,结果表明,ML-GM在平均精确度、AUC、1-错误率和汉明损失上都有优越性。In order to solve the problem that the current multi-label classification algorithm has low classification accuracy and high computational complexity,a centroid-based multi-label model for text categorization,named Multi-label Gravitation Model(ML-GM),is proposed.In the training phase,a similarity interval by calculating the similarity between the document and the centroid of the class.In the test phase,multi-label classification is performed by comparing the similarity between the undefined document and the class centroid is within the similarity interval.The model solves the problem of high computational complexity and low classification accuracy by introducing a centroid classifier and a gravity model.The Yahoo dataset is used in the experiment,and the results show that ML-GM achieves supe-rior performance in terms of average accuracy,AUC,one-error and hamming loss.
关 键 词:文本分类 质心分类器 多标签学习 引力模型 相似度区间
分 类 号:TP321[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.133.106.206