基于仿射聚类的宏基因组序列物种聚类  被引量:1

Metagenomic DNA Sequence Binning based on Affinity Propagation

在线阅读下载全文

作  者:聂鹏宇[1,2] 潘玮华[1,2] 徐云[1,2] 

机构地区:[1]安徽省高性能计算重点实验室,安徽合肥230027 [2]中国科学技术大学计算机科学与技术学院,安徽合肥230027

出  处:《计算机系统应用》2013年第11期165-170,142,共7页Computer Systems & Applications

基  金:国家自然科学基金面上项目(60970085)

摘  要:随着下一代测序技术的迅猛发展,宏基因组学已经成为新的研究热点,宏基因组学序列聚类问题使用无参考的方法,对包含多个物种的宏基因组序列进行有效分离.为此,提出一种结合相似度信息和结构信息的宏基因组物种聚类算法,并引入仿射聚类来进行序列物种聚类.实验数据表明该方法聚类精度高、执行速度快.我们也开发了基于该方法的宏基因组序列物种聚类软件.Nowadays, with the rapid development of the next generation sequencing technologies, metagenomics have become a new hotspot, However research in metagenomics faces the issue of binning --- identification and taxonomic characterization of the NGS short reads. To solve this problem, this paper first analyzes the next generation sequencing technology characteristics, statistical characteristics of metagenomic sequence, then proposes a new clustering method for DNA sequence binning. Test results show that this method has a very good clustering accuracy. In the same time, we developed an software for metagenornic binning based on this algzorithm MetaBinning.

关 键 词:宏基因组学 DNA序列 物种聚类 仿射聚类 倒排索引 

分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象