cDNA芯片缺失值处理对基于基因表达谱的疾病分类的影响  被引量:3

Influence of missing values replacement on disease classification analysis based on gene expression profiles

在线阅读下载全文

作  者:王栋[1] 郭政[1,2,3] 李霞[1,2,3] 吕莹丽[1] 朱晶[1] 王晨光[1] 

机构地区:[1]哈尔滨医科大学生物信息学系,哈尔滨150086 [2]同济大学生命科学与技术学院,上海200092 [3]哈尔滨基太生物芯片开发有限责任公司,哈尔滨150090

出  处:《高技术通讯》2006年第5期501-505,共5页Chinese High Technology Letters

基  金:国家自然科学基金(30370798,30170515,30370388)资助项目.

摘  要:选取了4套cDNA芯片数据,分别运用补零和K近邻的方法,对有检测缺失的基因进行了补缺失值处理,分析了不同处理对支持向量机、K近邻分类器、决策树三种分类器分类效能的影响.结果显示: 在cDNA基因表达谱数据中,对检测缺失率不高于5%的基因补缺失值是一种较好的策略,这样可以保留较多的基因供后续的功能分析,同时仍然能够保持很高的疾病分类效能.In this article, two different missing value treatments (replacing with zeros, KNN estimations) combined with three kinds of classifiers, support vector machine(SVM), K-nearest neighbor(KNN) and decision tree(DT), were used to evaluate the effect on four data sets. The results showed that when the missing value rate was less than 5 %, enough genes for classification will remain arid quite high classification accuracy can be still got.

关 键 词:基因表达谱 缺失值 分类 

分 类 号:TP391.4[自动化与计算机技术—计算机应用技术] Q786[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象