基于粗糙集成学习的半监督属性约简  被引量:6

Semi-supervised Data Attribute Reduction Based on Rough-subspace Ensemble Learning

在线阅读下载全文

作  者:张维[1,2,3] 苗夺谦[1,3] 高灿[4,5] 李峰[1,3] 

机构地区:[1]同济大学电子与信息工程学院计算机科学与技术系,上海201804 [2]上海电力学院计算机科学与技术学院,上海200090 [3]同济大学嵌入式系统与服务计算教育部重点实验室,上海201804 [4]深圳大学计算机与软件学院,广东深圳518060 [5]香港理工大学应用科学与纺织学院

出  处:《小型微型计算机系统》2016年第12期2727-2732,共6页Journal of Chinese Computer Systems

基  金:国家自然科学基金项目(61273304)资助;2013年度高等学校博士学科点专项科研基金项目(20130072130004)资助

摘  要:属性约简是粗糙集理论重要研究内容之一.Pawlak粗糙集约简的对象一般是有监督数据或者是无监督数据.而在很多现实问题中有标记数据很有限,更多的是无标记数据,即半监督数据.仅利用有标记数据一般难以计算出质量较好的属性约简.为此,基于粗糙集理论,结合集成学习与半监督学习,提出有效地利用无标记数据计算半监督数据属性约简算法.该算法在有标记数据上构造一组差异性较大的属性约简构造集成基分类器,在半监督自训练学习过程中,用集成分类器对无标记数据做出预测,扩大有标记数据集,从而获得质量更好的约简.UCI数据集实验分析表明该算法是有效可行的.Attribute reduction is an important issue in rough set theory. Rough set theory is an effective learning model for supervised data or unsupervised data. However, attribute reduction for semi-supervised data is outside the realm of traditional rough set theory. In this paper, a rough set attribute reduction algorithm for semi-supervised data is proposed, based on rough-subspace ensemble learning which capitalizes on the unlabeled data to improve the quality of attribute reducts from few labeled data. It gets a group of diverse re- ducts of the labeled data, employs them to train a group of base classifiers for ensemble classifying, then the base classifiers predict the the unlabeled data and enlarge the labeled data, so better quality reducts could be computed from the enlarged labeled data. The experi- mental results with UCI data sets show that the proposed algorithm can compute better attribute reducts for semi-supervised data.

关 键 词:属性约简 粗糙集 自训练 半监督学习 半监督数据 

分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象