基于LASSO类方法的Ⅰ类错误的控制  被引量:2

在线阅读下载全文

作  者:许树红[1] 王慧[1] 孙红卫[1] 王彤[1] 

机构地区:[1]山西医科大学卫生统计教研室,030001

出  处:《中国卫生统计》2017年第4期660-666,共7页Chinese Journal of Health Statistics

基  金:国家自然科学基金项目(81473073)

摘  要:全基因组关联研究(genome-wide association studies,GWAS)是在全基因组范围内同时研究上百万个单核苷酸多态性(single nucleotide polymorphism,SNP)位点与疾病或某些性状之间的关联,从而筛选出可能的致病SNP位点,进而对这些位点进行人群验证和实验分析。在GWAS研究中比较传统的分析方法是针对每个SNP和结局变量间关联进行单因素分析的假设检验,而待分析的SNP数量有几十万甚至上百万个,使得检验次数十分巨大,如果不采用合适的方法进行多重性校正来妥善控制Ⅰ类错误,会产生许多假阳性结果,对这些结果进行验证将耗费很多时间和财力,造成不必要的损失。针对全基因组测序数据进行多因素建模常采用的分析策略为降维和变量选择。

关 键 词:结局变量 关联研究 假设检验 LASSO 百万个 单核苷酸多态性 高维数据 回归系数 原始变量 因素分析 

分 类 号:O213[理学—概率论与数理统计] R346[理学—数学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象