基于稳定相关系的超高维筛选研究  

Feature Screening for Ultra-High Dimensional Data Based on Stable Correlation Coefficient

在线阅读下载全文

作  者:闫习 

机构地区:[1]南京信息工程大学数学与统计学院,江苏 南京

出  处:《应用数学进展》2021年第11期3777-3782,共6页Advances in Applied Mathematics

摘  要:特征筛选是超高维数据分析中非常重要的一环,筛选降维过程的准确性将影响到后续的建模分析。针对稳定特征筛选方法(SC-SIS)的不足之处进行改进,基于稳定相关系数提出了适用于超高维无模型假设下稳健特征筛选方法(RSCS),相比SC-SIS,该方法对数据中存在异常点或协变量服从重尾分布更有稳健性,从理论上证明了RSCS方法具有确定性筛选性质,并通过蒙特卡洛数值模拟和小鼠基因组数据验证了RSCS方法的有限样本性质。Feature screening is an important part of ultra-high-dimensional data analysis. The accuracy of the screening and dimensionality reduction process will affect the subsequent modeling analysis. Aiming at the shortcomings of the stable feature screening method (SC-SIS), based on the stable correlation coefficient, a robust feature screening method (RSCS) suitable for ultra-high-dimensional model-free assumptions is proposed. This paper proves theoretically that the proposed feature screening method satisfies the sure screening property. Numerical simulation and a real data application under the finite sample are conducted to evaluate the performance of the proposed method.

关 键 词:超高维数据 稳定相关系数 确定性筛选性质 稳健性 

分 类 号:TP3[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象