高维数据回归分析中基于LASSO的自变量选择  被引量:28

在线阅读下载全文

作  者:张秀秀[1] 王慧[1] 田双双[1] 乔楠[1] 闫丽娜[2] 王彤[1] 

机构地区:[1]山西医科大学卫生统计教研室030001 [2]河北医科大学卫生统计教研室050017

出  处:《中国卫生统计》2013年第6期922-926,共5页Chinese Journal of Health Statistics

基  金:国家自然科学基金(81072385);全国统计科研计划重点项目(2009LZ033)

摘  要:生物信息学背景下普遍存在着高维数据,所谓的“高维”即待估计的未知参数的个数是样本量的一个或几个数量级,例如Van’t Veer(2002)心0等学者收集的乳腺癌数据集共包括259例乳腺癌患者,25000个微阵列基因数据,研究变量个数25000远远大于样本量259,存在“高维”现象。传统的方法进行参数估计和统计推断的一个必要前提是待估参数的个数小于样本量,这样统计推断的结果才是稳定、可靠的。

关 键 词:维数 变量选择 回归分析 乳腺癌患者 统计推断 生物信息学 样本量 基因数据 

分 类 号:R195[医药卫生—卫生统计学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象