基于RNA-Seq数据集的转录组从头拼接算法  

De Novo Transcriptome Assembly Algorithm Based on RNA-Seq Datasets

在线阅读下载全文

作  者:武思文 李静[1] 张少强[1] WU Si-wen;LI Jing;ZHANG Shao-qiang(College of Computer and Information Engineering,Tianjin Normal University,Tianjin 300387,China)

机构地区:[1]天津师范大学计算机与信息工程学院,天津300387

出  处:《计算机科学》2018年第12期308-312,共5页Computer Science

基  金:国家自然科学基金(61572358);天津自然科学基金(16JCYBJC23600)资助

摘  要:转录组拼接是基因组测序与功能注解问题的一个重要组成部分。为了提高转录组拼接的精度和效率,文中提出了一种新的转录组从头拼接算法StepLink。该算法的主要创新点是提出了最左k-mer(长度为k的短序)和右k-mer的概念,并运用双重哈希表来存储相邻的每对k-mer,使得拼接更加迅速、准确。应用该算法对SRA数据库中人、狗和老鼠的测序数据分别进行拼接,结果表明该算法比其他已有算法更高效。Transcriptome assembly is an important part of genome sequencing and function annotations.To improve the precision and efficiency of transcriptome assembly,this paper presented a new de novo transcriptome assembly algorithm called StepLink.The main innovations of this algorithm are presenting two concepts,namely leftmost k-mer(short sequence of length k)and right k-mer,and using the hash of hashes table to store the k-mer pairs,which makes the assembly more quickly and accurately.This algorithm was used to assemble the datasets of human,dog and mouse in the SRA databases respectively.The experimental results suggest that the proposed algorithm has higher efficiency than other existing algorithms.

关 键 词:转录组 RNA-SEQ K-mer 从头拼接算法 

分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象