检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:李江域[1,2] 王小磊[1] 刘阳[1] 毛逸清[1] 赵东升[1] 王玉民[2]
机构地区:[1]军事医学科学院卫生勤务与医学情报研究所,北京100850 [2]军事医学科学院生物工程研究所,北京100074
出 处:《北京生物医学工程》2013年第5期463-466,496,共5页Beijing Biomedical Engineering
摘 要:目的设计一种基于高通量测序数据的功能强大、处理速度快且不依赖于运行环境的本地化的微生物检测算法。方法对微生物基因组进行分组,每次使用一组微生物基因组提取映射到其上的测序数据并滤除数据中的人类基因组数据,然后对序列进行拼接和拼接片段比对。如果根据比对结果检测出微生物种属则流程结束,否则使用下一组微生物基因组进行分析。若使用所有微生物基因组分析结束后仍未确定微生物种属,则滤除剩余的测序序列中的人类测序数据并进行拼接,拼接片段通过序列比对无法匹配到微生物基因组,则将这些拼接片段归为未知病原微生物的基因组片段。结果利用新的检测算法对模拟数据和实际测序数据进行分析,以RINS作为对比。对于已知病原微生物,新算法的平均处理时间为75 min,RINS的平均处理时间为767 min,两个算法检测结果一致,新算法得到的拼接序列更长。对于未知病原微生物样本,新算法检测的平均处理时间为64min,RINS的为584min,新算法得到了较完整的原始序列。对于实测数据,新算法的平均处理时间为23 min,RINS的为68 min,检测结果一致。结论本文实现的微生物检测算法能够对微生物进行准确、快速的检测,同时,新的检测算法可以发现未知的微生物并获取未知微生物的基因组片段。Objective To design a microorganism detecting algorithm based on high-throughput sequencing that can detect the sample fast and be independent of any runtime environment. Methods The microorganism genomes are divided into the groups of bacteria,virus and fungi. First we use the virus genomes as reference to get the reads mapped to them, and filter the human sequencing data, then assemble the reads and align the eontigs to virus genomes. If the microorganism is virus, the detecting finished, otherwise, genome sequencing of bacteria and fungi is used if the microorganism does not belong to the former group. If we still cannot get result when all the groups have been used ,we use the sequencing data left to filter the human data and assemble the rest reads. After verified, the contigs are the genome fragment of unknown microorganism. Results The simulated data and real sequencing data are analyzed by the new algorithm and RINS to compare. The detecting results are the same yet the runtime of new algorithm is 75 rain and 64 min for the two simulated data and 23 min for SRR073726, comparing to RINS being 767 rain, 64 min and 68 min, respectively. For the two simulated sequencing,the outputs of new algorithm are much longer than those of RINS. Conclusions The new algorithm can detect the microorganism fast and accurately,and can also detect the unknown microorganism and output the fragments of its genome.
关 键 词:高通量测序 微生物检测 序列比对 序列拼接 算法
分 类 号:R318.04[医药卫生—生物医学工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.124