检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:杨鹏[1] 吕强[1,2] 杨凌云[1] 吴进珍[1] 温炜[1]
机构地区:[1]苏州大学计算机科学与技术学院,江苏苏州215006 [2]江苏省计算机信息处理重点实验室,江苏苏州215006
出 处:《计算机与应用化学》2010年第5期573-576,共4页Computers and Applied Chemistry
基 金:国家自然科学基金项目(60970055)
摘 要:在计算生物学中,根据蛋白质的氨基酸序列预测蛋白质的结构是尚未解决的重要问题之一,而其中的1个难点是预测蛋白质中Loop片段的结构。本文用1阶马尔可夫模型为基础,通过对其训练,可根据氨基酸串和2级结构信息为蛋白质Loop片段概率建模和采样。其中用Ramachandran图示法的二面角对描述蛋白质结构,模型的训练和推理通过工具包Mocapy来完成。并使用KL交叉熵和角度差异值作为实验检验标准来完成Loop分布情况的测试实验,同时在从头预测Loop结构实验中预测CASP8中8个自由建模的蛋白质结构。与最流行的方法相比,本文提出的模型因为改进了Loop段的预测精度,从而可使得到的二面角对更加接近真实Loop结构中分布,同时在从头预测中提高整个蛋白质结构的预测精度。并且由于本文的模型具有概率推理特性,故在理论上也更具有无偏见性。Predicting the three-dimensional structure of a protein given its amino acid sequence remains one of the greatest challenges in computational biology, and the Loop structure prediction is a difficulty to complete this challenge. Based on the first-order Markov model this paper presents a probabilistic model of Loop protein structure. And after the model is trained, can be sampled the dihedral angle pairs represented by real values when given the amino acid sequence and second structure information. The dihedral angle pairs are used by Ramachandran to describe the protein's structure. And the model was trained by using the Mocapy DBN toolkit. In order to evaluate model's performance, 8 of free modeling targets of CASP8 are chose for the experimentation. And we use KL divergence and angular deviation as the criterion of experimentation. Compared with the state-of-art programs of protein structure prediction, the model enhances the Loop structure prediction accuracy and helps to improve the full protein backbone accuracy. Hence the model is a generative probabilistic model, it is more reasonable in theory.
关 键 词:蛋白质Loop 1阶马尔可夫概率生成模型 双变量yon Mises分布
分 类 号:TP311.131[自动化与计算机技术—计算机软件与理论] O6-39[自动化与计算机技术—计算机科学与技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.117

