基于Memetic优化的智能DNA序列数据压缩算法  被引量:2

Intelligent DNA Sequence Data Compression Using Memetic Algorithm

在线阅读下载全文

作  者:周家锐[1,2,3] 纪震[2,3] 朱泽轩[2,3] 陈思平[1,2,3] 

机构地区:[1]浙江大学生物医学工程与仪器科学学院,浙江杭州310027 [2]深圳大学计算机与软件学院,广东深圳518060 [3]深圳市嵌入式系统设计重点实验室,广东深圳518060

出  处:《电子学报》2013年第3期513-518,共6页Acta Electronica Sinica

基  金:国家自然科学基金(No.61171125;No.60872125;No.61001185;No.61211130120);霍英东高等院校青年教师基金基础性研究课题;教育部重点研究项目;广东省自然科学基金(No.10151806001000002);深圳市杰青项目

摘  要:提出近似重复矢量(Approximate Repeat Vector,ARV)模型用于DNA序列冗余片段的描述.通过将数据生物信息学特征引入压缩预处理,并使用ARV矢量构造编码码本,提出了非对称DNA序列压缩算法BioLZMA-2.算法引入基于粒子群优化的Memetic改进方法CLIPSO-MA用于压缩码本的智能优化设计,有效提升了编码性能.在标准测试序列上的实验结果表明,BioLZMA-2可获得比现有DNA序列数据压缩方法更高的压缩率.A data model namely the approximate repeat vector(ARV) is introduced to describe the similar fragments in DNA sequences.By employing bioinformatics features in data preprocessing,and using ARVs in compression codebook’s construction,we propose an asymmetric DNA sequence compression algorithm of biological Lempel-Ziv-Markov chain algorithm 2(BioLZMA-2).The particle swarm optimization(PSO) based memetic algorithm improvement namely the comprehensive learning intelligent particle swarm optimization memetic algorithm(CLIPSO-MA) is employed in the compression codebook’s design.Experimental results on benchmark sequences demonstrate better performance of BioLZMA-2 than the original DNA sequence compression algorithms.

关 键 词:DNA序列数据压缩 生物信息学 近似重复矢量 MEMETIC算法 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象