基于添加模体信息和功率谱密度的组合向量预测27类蛋白质折叠子  被引量:1

Predicting 27-Class Protein Folds Based on Combined Vector of Adding Motif and Power Spectral Density

在线阅读下载全文

作  者:刘雷[1] 胡秀珍[1] 

机构地区:[1]内蒙古工业大学理学院,呼和浩特010051

出  处:《生物物理学报》2010年第9期823-832,共10页Acta Biophysica Sinica

基  金:国家自然科学基金项目(30960090);内蒙古自治区高等学校科学研究项目(NJZY08059)~~

摘  要:以序列相似性低于40%的1895条蛋白质序列构建涵盖27个折叠类型的蛋白质折叠子数据库,从蛋白质序列出发,用模体频数值、低频功率谱密度值、氨基酸组分、预测的二级结构信息和自相关函数值构成组合向量表示蛋白质序列信息,采用支持向量机算法,基于整体分类策略,对27类蛋白质折叠子的折叠类型进行预测,独立检验的预测精度达到了66.67%。同时,以同样的特征参数和算法对27类折叠子的4个结构类型进行了预测,独立检验的预测精度达到了89.24%。将同样的方法用于前人使用过的27类折叠子数据库,得到了好于前人的预测结果。A New protein fold dataset containing 1895 proteins with sequence identity below 40%,and classified into 27 fold types,was built for prediction.Based on protein sequence,by using motif frequency,low frequency of power spectral density,amino acid composition,predicted secondary structure and values of auto-correlation function as combined vector,an approach of support vector machine for predicting 27-class protein folds based on ensemble classifier is proposed.Overall predicting accuracy reaches 66.67% in independent testing dataset.With the same method,overall accuracy of predicting 4 folding structure classes is 89.24%.For predicting dataset provided by previous researchers,the result is better than others.

关 键 词:模体频数 功率谱密度 支持向量机 蛋白质折叠子 蛋白质结构类型 

分 类 号:Q61[生物学—生物物理学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象