检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《生物物理学报》2010年第9期823-832,共10页Acta Biophysica Sinica
基 金:国家自然科学基金项目(30960090);内蒙古自治区高等学校科学研究项目(NJZY08059)~~
摘 要:以序列相似性低于40%的1895条蛋白质序列构建涵盖27个折叠类型的蛋白质折叠子数据库,从蛋白质序列出发,用模体频数值、低频功率谱密度值、氨基酸组分、预测的二级结构信息和自相关函数值构成组合向量表示蛋白质序列信息,采用支持向量机算法,基于整体分类策略,对27类蛋白质折叠子的折叠类型进行预测,独立检验的预测精度达到了66.67%。同时,以同样的特征参数和算法对27类折叠子的4个结构类型进行了预测,独立检验的预测精度达到了89.24%。将同样的方法用于前人使用过的27类折叠子数据库,得到了好于前人的预测结果。A New protein fold dataset containing 1895 proteins with sequence identity below 40%,and classified into 27 fold types,was built for prediction.Based on protein sequence,by using motif frequency,low frequency of power spectral density,amino acid composition,predicted secondary structure and values of auto-correlation function as combined vector,an approach of support vector machine for predicting 27-class protein folds based on ensemble classifier is proposed.Overall predicting accuracy reaches 66.67% in independent testing dataset.With the same method,overall accuracy of predicting 4 folding structure classes is 89.24%.For predicting dataset provided by previous researchers,the result is better than others.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.62