区间型符号数据的特征选择方法  被引量:2

A Feature Selection Method for Symbolic Interval Data

在线阅读下载全文

作  者:郭崇慧[1] 刘永超[1] 

机构地区:[1]大连理工大学系统工程研究所,辽宁大连116024

出  处:《运筹与管理》2015年第1期67-74,共8页Operations Research and Management Science

基  金:国家自然科学基金资助项目(71171030;71031002);教育部新世纪优秀人才支持计划(NCET-11-0050)

摘  要:对区间型符号数据进行特征选择,可以降低数据的维数,提取数据的关键特征。针对区间型符号数据的特征选择问题,本文提出了一种新的特征选择方法。首先,该方法使用区间数Hausdorff距离和区间数欧氏距离度量区间数的相似性,通过建立使得样本点与样本类中心相似性最大的优化模型来估计区间型符号数据的特征权重。其次,基于特征权重构建相应的分类器来评价所估计特征权重的优劣。最后,为了验证本文方法的有效性,分别在人工生成数据集和真实数据集上进行了数值实验,数值实验结果表明,本文方法可以有效地去除无关特征,识别出与类标号有关的特征。Feature selection for symbolic interval data can reduce the dimension of data and extract the key fea -tures of data.In order to deal with the feature selection problem , a new method is proposed in this paper .Firstly, Hausdorff distance and Euclidean distance are utilized to measure the similarity between two interval numbers , and an optimization model , which aims to maximize the similarity between each sample and its class center , is established to estimate the feature weights for symbolic interval data .Next, based on the estimated feature selec-tion weights, a classifier is constructed to evaluate the goodness of the weights .Finally, in order to verify the effectiveness of the proposed method , numerical experiments are done in artificially generated data sets and real data sets , respectively . The numerical experiments results show that the proposed algrithm can eliminate irrelevant features and identify features which are relevant to the class labels .

关 键 词:符号数据分析 特征选择 最近邻分类器 区间型数据 

分 类 号:O235[理学—运筹学与控制论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象