检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:张懿璞[1] 霍红卫[1] 于强[1] 郭鸿志[1]
机构地区:[1]西安电子科技大学计算机学院,西安710071
出 处:《计算机学报》2013年第12期2545-2559,共15页Chinese Journal of Computers
基 金:国家自然科学基金(61173025;61373044);高等学校博士学科点专项科研基金(20100203110010);中央高校基本科研业务费(K5051303032;K50513100011)资助~~
摘 要:定位转录因子结合位点,也称模体发现问题,对于理解基因调控关系非常重要.文中提出了一种新的定位投影求精算法(Fixed-Position Projection Refinement algorithm,FPPR)用于DNA序列中的转录因子结合位点识别.通过一个基于数据集对应位置频率矩阵的投影过程,将DNA数据聚类为不同的子集,过滤选出其中具有一定信息量和复杂度的子集,作为初始状态,进而使用期望最大化算法进行求精.FPPR通过对定位投影过程中阈值的设定,实现了对OOPS、ZOOPS、TCM这3种模型中不同模体实例分布的处理.同时,结合高阶马尔可夫背景设计目标函数,使得算法的概率模型更加符合真实生物数据.此外,通过相似函数WIC评估,FPPR可拓展为解决多模体识别问题.真实数据测试表明,FPPR可以在合理的时间内准确找寻模体,与MEME、GAME、Motif Sampler和GALP-F等算法相比有更好的性能,并且可以有效地解决多模体识别问题.Locating the transcription factor bin for understanding the gene regulatory relations ding sites (TFBS), motif discovery, are crucial hip. This paper proposes a novel fixed-position projection refinement algorithm (FPPR) to identify the TFBS of DNA sequences. FPPR clusters DNA data into different subsets through a projection based on the corresponding probabilistic fre- quency matrix, and filters the subsets with certain information score and complexity which are used as the initial condition for expectation maximum refinement. FPPR achieves the different motif instances distribution in the model OOPS, ZOOPS and TCM by setting the threshold in the fixed-position projection. Meanwhile, FPPR can be extended to a multiple motifs discovery ver- sion by using the similarity function WIC. Experiments on the real datasets demonstrate our algo- rithm finds real motifs accurately in a proper time. Comparing with MEME, GAME, Motif Sampler and GALP-F, FPPR has the better performance, and it can solve the multiple motifs discovery effectively.
分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222