检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:胡春玲 赵俊杰[2] 姚梦媛 高欢欢 朱艺杭 汪少鸿 Hu Chunling;Zhao Junjie;Yao Mengyuan;Gao Huanhuan;Zhu Yihang;Wang Shaohong(School of Artificial Intelligence and Big Data,Hefei University,Hefei 230031,China;School of Computer Science and Artificial Intelligence,Zhengzhou University,Zhengzhou 450001,China)
机构地区:[1]合肥大学人工智能与大数据学院,安徽合肥230031 [2]郑州大学计算机与人工智能学院,河南郑州450001
出 处:《南京师范大学学报(工程技术版)》2024年第4期37-45,共9页Journal of Nanjing Normal University(Engineering and Technology Edition)
基 金:国家自然科学基金青年项目(62306100);安徽省教学研究重大项目(2023jyxm0558).
摘 要:生物信息学中,大规模的生物基因序列比对是最重要的基础问题.针对主流的BWT(burrows-wheeler transform)索引技术的研究,提出一种新的多阶混合BWT索引方法MD-BWT(multi difference cover mod3 burrows-wheeler transform),根据待比对序列的长度,动态选取适合的多位索引查找.实验结果表明,改进后的方法可以有效减少序列比对算法中的比对次数和计算次数,降低序列比对算法中索引算法的时间复杂度,明显提高序列比对的效率.在构造BWT(S)字符串过程中,通过DC3(difference cover mod 3)算法来构造后缀数组,实验表明DC3算法构造后缀数组比倍增算法的时间复杂度更低,时间性能更优.Large-scale gene sequence alignment is the most important fundamental problem in bioinformatics.Based on the mainstream research of BWT index technology,the paper proposes a new multi-order mixed BWT index method,which dynamically selects the appropiate multi-bit indexing according to the length of the sequence to be compared.The experimental results show that the improved method can effectively reduce the number of comparison and calculation times,reduce the time complexity of the index algorithm,and significantly improve the efficiency of sequence comparison.In the process of constructing BWT(S)string,this paper uses DC3(difference cover mod 3)algorithm to construct the suffix array.Experiments show that DC3 algorithm has better time performance compared to Binary Lifting.
分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.145