利用基因表达谱对组织样品分类方法的研究  被引量:7

A Study to Classify Tissues Samples Based on Gene Expression Profile

在线阅读下载全文

作  者:张瑞杰[1] 许杰[1] 王增权[2] 郭政[1] 李霞[1] 李康[3] 

机构地区:[1]哈尔滨医科大学数学与生物信息研究室,150086 [2]哈尔滨工程大学计算机学院 [3]哈尔滨医科大学公卫学院卫生统计教研室

出  处:《中国卫生统计》2003年第1期2-5,共4页Chinese Journal of Health Statistics

摘  要:目的 探讨在基因表达谱数据分析中用主成分分析方法结合层次聚类法与K -均值聚类方法两种分类方法对组织样品分类的分类效果。方法 用主成分分析方法对数据降维后进行聚类分析 ,与不经主成分分析直接聚类 ,并结合筛选与组织样品分型相关的基因的各种筛选水平 ,评价聚类效果。结果 用约当指数进行评价两种聚类方法 :经主成分分析后用提取的主成分聚类与不用主成分的直接聚类效果不同 ;不同筛选相关基因的筛选水平对聚类效果也有影响。结论 对组织样品做聚类分析时 ,主成分分析能提高聚类质量 。Objective To study application of principal components analysis in gene expression profile when hierarchical clustering and K-means clustering were applied to tissues samples classification. Methods To compare the two clustered results, one is clustering directly, another is clustering after principal components analysis, integrated different significant levels of selecting relative genes. Results By using Rand index, there are some difference between the two clustered results, and it is also associated with different significant levels. Conclusion The result showed that principal components analysis improved cluster quality, and they also were different with the number of differential expression genes filtered.

关 键 词:组织样品 分类方法 基因表达谱 聚类分析 主成分分析 差异表达基因 

分 类 号:R346[医药卫生—基础医学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象