基于类别空间的基因选择  被引量:9

在线阅读下载全文

作  者:张军英[1] Y.J.Wang J.Khan R.Clarke 

机构地区:[1]西安电子科技大学雷达信号处理国防重点实验室 [2]Electrical Engineering Institute,The Catholic University of America,Washington DC20064,USA [3]Cancer Genetics Branch,National Human Genome Research Institute,National Institutes of Health,Bethesda,Maryland,USA [4]Lombardi Cancer Center,Georgetown University,Washington DC,USA

出  处:《中国科学(E辑)》2003年第12期1125-1137,共13页Science in China(Series E)

基  金:美国国家健康研究院(NIH)/美国国家癌症研究院(NCI)研究基金(5R21CA83231);中国国家自然科学基金(批准号:60071026;60371044);国防科技预研基金(00J1.4.4.DZ0106);图像信息处理与智能控制国家教育委员会开放实验室基金(TKLJ0005)

摘  要:基因选择通常是在基因空间中进行的.由于基因空间的维数(基因数目)比该空间中的样本数要多得多,这种做法存在严重的维数发难(curse of dimensionality)问题,其结果是在基因空间中所建立数据模型难于获得满意的精度,基于所建立模型的基因选择结果可信度低.如何对具有极少样本的极高维空间进行特征选择(基因选择)是一个极具挑战性的课题.将基因空间变换为它的对偶空间,称为类别空间,从而空间的维数仅为基因空间中样本的类别数,空间中的样本数则为基因空间的维数.显然,在类别空间中不存在任何维数发难现象;提出了在类别空间中基于将不同的类尽可能分开的原则、并借助主分量分析的基于类别空间基因选择方法.对真实基因数据的基因选择实验,并通过Fisher指标、加权Fisher指标以及leave-one-out cross validation等可分性指标,与其他两种基因选择方法进行了深入的比较,结果表明该方法是十分有效的.

关 键 词:类别空间 基因选择 特征空间 特征选择 主分量分析 维数发难 DNA微阵列数据 基因诊断 基因表达 

分 类 号:Q75[生物学—分子生物学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象