检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]安徽师范大学数学计算机学院,安徽芜湖241003
出 处:《计算机工程与应用》2011年第18期163-165,共3页Computer Engineering and Applications
基 金:国家自然科学基金(No.61070060)~~
摘 要:编码方式是影响蛋白质二级结构预测准确率的重要因素之一。针对单序列蛋白质二级结构预测问题,提出了一种新的综合编码方法。该编码是根据氨基酸出现在每种二级结构中的倾向因子以及氨基酸的疏水性值进行分类,并以二进制形式来表示每类氨基酸的编码方法。在相同的实验条件下,首先用不同的编码方式对数据集CB513进行编码,然后采用支持向量机的方法进行训练建模预测。实验结果显示提出编码的预测准确率比20位正交编码和5位编码分别高出1.48%和10.68%。可见,该编码比较适合非同源或低同源蛋白质结构预测。Coding scheme plays an important role on determining the protein secondary structure prediction.A new comprehensive coding scheme is suggested to use for single-sequence protein secondary structure prediction.The method regards not only the trending factor of every amino acid appearance in protein secondary structure,but also the value of amino acid hydrophobicity,and it uses binary form to express all kinds of amino acid.The different code schemes are used to state the date set of CB513.Then,the theory of Support Vector Machine(SVM) is applied to protein secondary structure prediction. The results show that the prediction accuracy of the new coding scheme are about 1.48% and 10.68% higher than the classical orthogonal matrix and the five coding,respectively.It showes that this coding is more suitable for non-homologous or lower homologous protein structure prediction.
分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.229