检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:张陶陶[1,2] 胡亚南[1,2] 李扬[1,2] 田茂再[1,2,3,4,5]
机构地区:[1]中国人民大学应用统计科学研究中心,北京100872 [2]中国人民大学统计学院,北京100872 [3]新疆财经大学新疆社会经济统计研究中心,乌鲁木齐830012 [4]新疆财经大学统计与信息学院,乌鲁木齐830012 [5]兰州财经大学统计学院,兰州730101
出 处:《统计与决策》2017年第4期18-24,共7页Statistics & Decision
基 金:中国人民大学科学研究基金(中央高校基本科研业务费专项资金资助)项目(15XNL008)
摘 要:文章研究了一种高维数据聚类特征选择方法——稀疏聚类,稀疏聚类是通过对特征变量赋予权重,并添加lasso惩罚因子,压缩权重,得到对变量的权重排序,即重要性排序,使其在进行分类预测的同时达到自动剔除冗余变量的效果,从而起到了对高维数据聚类时的特征选择作用。将此方法运用于中国环保问题,将中国31个省份根据环保情况分为3类,并从现有的104个环保指标中筛选得到20个重要指标。This paper investigates a feature selection method in high-dimensional data clustering called sparse clustering,which gives different weights to the features and select the features using a lasso-type penalty. Sparse clustering can help one cluster the observations using an adaptively chosen subset of the features, namely, it plays a role of feature selection in high-dimensional data. this paper applies sparse clustering on China' s environmental problems, dividing 31 provinces to 3 parts according to environmental condition and selecting 20 important items from 104 environmental items.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.229