检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]上海海事大学信息工程学院,上海201306 [2]上海海事大学数学系,上海201306
出 处:《数学的实践与认识》2016年第23期173-179,共7页Mathematics in Practice and Theory
基 金:国家自然科学基金(51409157);上海海事大学校基金项目(20110011)
摘 要:研究了DNA序列片段的查找问题,针对DNA数据量大和DNA序列碱基排列的特点提出了DNA序列检索的问题.在对DNA序列检索中,基于Hash建立了索引表以提高在大数据中检索的速度和效率,同时在平衡树的数据存储模型上使用了改进的Kmp快速匹配算法,提高了在索引上的检索效率.介绍了Hash索引的建立、Kmp的优化以及平衡树的再平衡.利用软件评估实验得出的实验结果表明了该算法的有效性.We have researched the way of finding DNA sequence fragment. According to the large volume of DNA data and the characteristics of the sequence of DNA bases, the question of DNA sequence retrival is raised. In the retrieval of DNA sequence, index table on the basis of Hash improves the speed and efficiency in the large data retrieval.At the same time, an improved Kmp fast matching algorithm used in the data storage model of balanced tree improves the retrieval efficiency of index. This article introduces the establishment of the Hash index, the optimization of Kmp and rebanlance of the balanced tree. The experiment evaluated by the software turns out this algorithm works effectively.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.38