基于PFD过滤器查找DNA序列中相似性重复片段  被引量:1

Partition Frequency Distance Based Filter Method for Finding Approximate Repetitions in DNA Sequences

在线阅读下载全文

作  者:吴青泉[1,2] 王国仁[2] 王镝[1] 胡大斌[1] 汪恒杰[1] 郭烨[1] 朱铭杰[3] 

机构地区:[1]上海宝信软件股份有限公司,上海201203 [2]东北大学信息科学与工程学院,沈阳110004 [3]上海市人民政府经济委员会信息中心,上海200003

出  处:《计算机研究与发展》2007年第z3期521-528,共8页Journal of Computer Research and Development

基  金:国家自然科学基金项目(60273079,60573089)

摘  要:在DNA序列中查找重复片段是基因序列分析的一个重要课题.由于重复片段的模式长度范围较大,所以仅使用编辑距离(edit distance)很难良好的衡量序列的相似性.提出了衡量重复片段相似性的新标准,新标准表达了序列间的距离与序列中相同部分的关系.考虑到计算的复杂性,基于频率向量提出了新的距离函数PFD(partition frequency distance)以及相应的过滤函数,用以产生重复片段的候选集,提高查找算法的效率.采用后继数组代替滑动窗口的方法进行序列划分,避免只可在等长的片段上查找重复片段的限制.实验结果表明,与TRF(tandem repeat finder)方法相比,基于PFD过滤函数的算法可以找到更多的满足相似性要求的重复片段.

关 键 词:DNA序列 相似性重复片段 编辑距离 频率距离 Pearson相关性 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象