检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:周家锐[1,2,3] 纪震[2,3] 朱泽轩[2,3] 陈思平[1,2,3]
机构地区:[1]浙江大学生物医学工程与仪器科学学院,浙江杭州310027 [2]深圳大学计算机与软件学院,广东深圳518060 [3]深圳市嵌入式系统设计重点实验室,广东深圳518060
出 处:《电子学报》2013年第3期513-518,共6页Acta Electronica Sinica
基 金:国家自然科学基金(No.61171125;No.60872125;No.61001185;No.61211130120);霍英东高等院校青年教师基金基础性研究课题;教育部重点研究项目;广东省自然科学基金(No.10151806001000002);深圳市杰青项目
摘 要:提出近似重复矢量(Approximate Repeat Vector,ARV)模型用于DNA序列冗余片段的描述.通过将数据生物信息学特征引入压缩预处理,并使用ARV矢量构造编码码本,提出了非对称DNA序列压缩算法BioLZMA-2.算法引入基于粒子群优化的Memetic改进方法CLIPSO-MA用于压缩码本的智能优化设计,有效提升了编码性能.在标准测试序列上的实验结果表明,BioLZMA-2可获得比现有DNA序列数据压缩方法更高的压缩率.A data model namely the approximate repeat vector(ARV) is introduced to describe the similar fragments in DNA sequences.By employing bioinformatics features in data preprocessing,and using ARVs in compression codebook’s construction,we propose an asymmetric DNA sequence compression algorithm of biological Lempel-Ziv-Markov chain algorithm 2(BioLZMA-2).The particle swarm optimization(PSO) based memetic algorithm improvement namely the comprehensive learning intelligent particle swarm optimization memetic algorithm(CLIPSO-MA) is employed in the compression codebook’s design.Experimental results on benchmark sequences demonstrate better performance of BioLZMA-2 than the original DNA sequence compression algorithms.
关 键 词:DNA序列数据压缩 生物信息学 近似重复矢量 MEMETIC算法
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222