大规模EST序列聚类的并行算法研究进展  被引量:1

Parallel algorithms of large-scale EST clustering:current progress

在线阅读下载全文

作  者:毛逸清[1] 赵东升[1] 李稚锋[2] 杭兴宜[2] 骆志刚[3] 张成岗[2] 

机构地区:[1]军事医学科学院卫生勤务与医学情报研究所,北京100850 [2]军事医学科学院放射与辐射医学研究所,北京100850 [3]国防科技大学并行与分布处理国防科技重点实验室,长沙410073

出  处:《军事医学科学院院刊》2006年第6期591-595,共5页Bulletin of the Academy of Military Medical Sciences

基  金:国家重点基础研究发展计划("973"计划)(2003CB715900);国家高技术研究发展计划("863"计划)(2002AA234021);国家自然科学基金重大研究计划(90208017);并行与分布处理国防科技重点实验室基金项目(51484050304JB4401);北京市科技新星计划A类(2005A44);军事医学科学院科技创新启动基金(0401001;0402013)资助

摘  要:EST是携带有表达基因部分遗传信息的cDNA片段,EST聚类是将来自同一个基因的具有重叠部分的EST整合到单一的类中,是进行后续基因表达数据分析的必要步骤。传统的串行聚类方法的计算复杂度高,对内存要求大,不适于进行大规模聚类计算。本文主要介绍了EST聚类的并行处理方式、软硬件支持环境,适用于大规模EST聚类的并行算法和软件,比较了几种现有软件的算法、计算速度和内存要求等,并讨论了现有大规模聚类算法的优缺点。Expressed sequence tag (EST) is a segment of cDNA, which contains some inheritable information of expressed gene. ESTs originating from the same gene can be grouped into one cluster according to their overlapping parts. Clustering is the necessary step to analyze expressed gene. Due to high computing complexity and large memory requirement, traditional serial computing methods cannot deal with large-scale EST clustering in common computing system. In this review, parallel processing methods and sustaining environments of software and hardware are introduced. Meanwhile, parallel algorithms and software that adapt to large-scale clustering are analyzed. In the end, by comparing computing speed and memory requirement of these algorithms, the advantages and disadvantages of each algorithm are discussed.

关 键 词:EST序列 聚类分析 高性能计算 并行算法 

分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象