检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:徐晓丹[1,2] 姚明海[1] 刘华文[2] 郑忠龙[2]
机构地区:[1]浙江工业大学信息工程学院,杭州310023 [2]浙江师范大学数理与信息工程学院,金华321004
出 处:《计算机科学》2015年第5期106-108,131,共4页Computer Science
基 金:浙江省教育厅项目(Y201328291);浙江省自然科学基金项目(LZ14F030001;LY14F020012)资助
摘 要:多标签学习已成为当前机器学习的研究热点。为了提高分类性能,对训练集中的噪声数据进行预处理,提出一种基于k近邻(kNN)的多标签分类去噪方法:对现有的多标签数据集进行分析后获得近似正态分布的特征,通过将噪声标记改为其k近邻标记的方法,滤去部分噪声信息,从而得到相对高质量的数据集。在MULAN平台上使用多个数据集对6种多标签分类算法进行了噪声去除前后的对比测试,实验结果表明,多标签的预处理方法有效提高了分类器的性能。此方法对于分布特征明显的数据集具有较好的适用性。Multi-label learning is a new field in machine learning. In order to improve the multi-label classification precision, a new kNN method was used to remove the noise labels. First, a normal distribution is discovered by analyzing the characteristics of multi-label datasets, and then the high quality datasets are generated by changing the value of noisy labels to their k-Nearest Neighbors. In the experiments, six kinds of multi-label classification methods were tested on MULAN with new datasets. Compared to the primal datasets, the classification precision based on new datasets is better. Research results show this method is suitable for the data set which has a regular distribution.
分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222