检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]大连理工大学系统工程研究所,辽宁大连116024
出 处:《运筹与管理》2015年第1期67-74,共8页Operations Research and Management Science
基 金:国家自然科学基金资助项目(71171030;71031002);教育部新世纪优秀人才支持计划(NCET-11-0050)
摘 要:对区间型符号数据进行特征选择,可以降低数据的维数,提取数据的关键特征。针对区间型符号数据的特征选择问题,本文提出了一种新的特征选择方法。首先,该方法使用区间数Hausdorff距离和区间数欧氏距离度量区间数的相似性,通过建立使得样本点与样本类中心相似性最大的优化模型来估计区间型符号数据的特征权重。其次,基于特征权重构建相应的分类器来评价所估计特征权重的优劣。最后,为了验证本文方法的有效性,分别在人工生成数据集和真实数据集上进行了数值实验,数值实验结果表明,本文方法可以有效地去除无关特征,识别出与类标号有关的特征。Feature selection for symbolic interval data can reduce the dimension of data and extract the key fea -tures of data.In order to deal with the feature selection problem , a new method is proposed in this paper .Firstly, Hausdorff distance and Euclidean distance are utilized to measure the similarity between two interval numbers , and an optimization model , which aims to maximize the similarity between each sample and its class center , is established to estimate the feature weights for symbolic interval data .Next, based on the estimated feature selec-tion weights, a classifier is constructed to evaluate the goodness of the weights .Finally, in order to verify the effectiveness of the proposed method , numerical experiments are done in artificially generated data sets and real data sets , respectively . The numerical experiments results show that the proposed algrithm can eliminate irrelevant features and identify features which are relevant to the class labels .
关 键 词:符号数据分析 特征选择 最近邻分类器 区间型数据
分 类 号:O235[理学—运筹学与控制论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222