高通量DNA测序数据压缩研究进展  被引量:4

Advances in the compression of high-throughput DNA sequencing data

在线阅读下载全文

作  者:朱泽轩[1] 张永朋[1] 尤著宏[1] 姜亮[2] 纪震[1] 

机构地区:[1]深圳市嵌入式系统设计重点实验室,深圳大学计算机与软件学院,深圳518060 [2]深圳大学生命科学学院,深圳518060

出  处:《深圳大学学报(理工版)》2013年第4期409-415,共7页Journal of Shenzhen University(Science and Engineering)

基  金:国家自然科学基金资助项目(61211130120,61001185)~~

摘  要:针对高通量DNA测序技术发展产生的DNA测序数据量猛增,数据压缩技术是解决存储和传输高通量DNA序列数据问题的重要方法之一.评述DNA测序数据传统压缩方法包括替代法和统计法,以及基于参考基因组的高通量DNA测序数据压缩方法,介绍并比较重测序数据压缩、从头测序数据压缩、质量分数压缩和压缩数据检索的代表性算法,研究高通量DNA测序数据压缩面临的挑战及对未来的展望.With the development of high-throughput DNA sequencing technology,DNA sequencing data grows rapidly.The use of compression techniques provides an important candidate solution for the storage and transmission challenges of high-throughput DNA sequencing data.In this paper,the traditional DNA sequences compression methods,including substitutionary and statistical methods,and the reference-genome-based compression method for high-throughput DNA sequencing data are surveyed.The state-of-the-art algorithms of re-sequencing data compression,de novo sequencing data compression,quality score compression,and compressed data indexing are introduced and compared.The challenges and future prospects of high-throughput DNA sequencing data compression are also discussed.

关 键 词:计算机应用 DNA测序 下一代测序 重测序 从头测序 高通量测序 数据压缩算法 

分 类 号:TP391[自动化与计算机技术—计算机应用技术] TP319[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象