用于转录因子结合位点识别的定位投影求精算法  被引量:2

A Novel Fixed-Position Projection Refinement Algorithm for TFBS Identification

在线阅读下载全文

作  者:张懿璞[1] 霍红卫[1] 于强[1] 郭鸿志[1] 

机构地区:[1]西安电子科技大学计算机学院,西安710071

出  处:《计算机学报》2013年第12期2545-2559,共15页Chinese Journal of Computers

基  金:国家自然科学基金(61173025;61373044);高等学校博士学科点专项科研基金(20100203110010);中央高校基本科研业务费(K5051303032;K50513100011)资助~~

摘  要:定位转录因子结合位点,也称模体发现问题,对于理解基因调控关系非常重要.文中提出了一种新的定位投影求精算法(Fixed-Position Projection Refinement algorithm,FPPR)用于DNA序列中的转录因子结合位点识别.通过一个基于数据集对应位置频率矩阵的投影过程,将DNA数据聚类为不同的子集,过滤选出其中具有一定信息量和复杂度的子集,作为初始状态,进而使用期望最大化算法进行求精.FPPR通过对定位投影过程中阈值的设定,实现了对OOPS、ZOOPS、TCM这3种模型中不同模体实例分布的处理.同时,结合高阶马尔可夫背景设计目标函数,使得算法的概率模型更加符合真实生物数据.此外,通过相似函数WIC评估,FPPR可拓展为解决多模体识别问题.真实数据测试表明,FPPR可以在合理的时间内准确找寻模体,与MEME、GAME、Motif Sampler和GALP-F等算法相比有更好的性能,并且可以有效地解决多模体识别问题.Locating the transcription factor bin for understanding the gene regulatory relations ding sites (TFBS), motif discovery, are crucial hip. This paper proposes a novel fixed-position projection refinement algorithm (FPPR) to identify the TFBS of DNA sequences. FPPR clusters DNA data into different subsets through a projection based on the corresponding probabilistic fre- quency matrix, and filters the subsets with certain information score and complexity which are used as the initial condition for expectation maximum refinement. FPPR achieves the different motif instances distribution in the model OOPS, ZOOPS and TCM by setting the threshold in the fixed-position projection. Meanwhile, FPPR can be extended to a multiple motifs discovery ver- sion by using the similarity function WIC. Experiments on the real datasets demonstrate our algo- rithm finds real motifs accurately in a proper time. Comparing with MEME, GAME, Motif Sampler and GALP-F, FPPR has the better performance, and it can solve the multiple motifs discovery effectively.

关 键 词:转录因子结合位点 模体 定位投影 求精 

分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象