基于字典的DNA序列压缩算法研究及应用  被引量:4

Research and Implementation of Dictionary-based DNA Compression Algorithm

在线阅读下载全文

作  者:林毅申[1] 林丕源[2] 彭宏[1] 

机构地区:[1]华南理工大学计算机科学与工程学院,广东广州510641 [2]华南农业大学信息学院,广东广州510642

出  处:《计算机应用研究》2007年第6期265-267,共3页Application Research of Computers

基  金:国家自然科学基金资助项目(30230350);广东省科技攻关资助项目(2005B10101033)

摘  要:在现有DNA序列数据压缩算法的基础上,以DNA序列数据的存储效率及生物学解释综合考虑,设计并实现了基于字典的DNA序列压缩算法DNADCompress。算法核心包括重复子串字典建立、字典项筛选、字串压缩编码三方面。实验数据表明,数据压缩算法压缩效果达到常用DNA序列压缩算法水平,并为序列生物学解释提供了基础。With the existing DNA compression algorithms based on dictionary, a new algorithm called DNADCompress based on dictionary was proposed and it achieved a balance between the store space and biology knowledge. The core of this algorithm includes the building dictionary of repeat strings, the selecting of dictionary items and the encoding of compression strings. The advantages of this algorithm were demonstrated by its good compression ratio and its explanation to the DNA sequences in bioinformatics.

关 键 词:数据压缩 生物信息学 DNA序列数据 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象