基于集成学习方法的蛋白质相互作用预测  被引量:1

Prediction of Protein-protein Interactions Based on Ensemble Learning

在线阅读下载全文

作  者:朱敏[1] 张永清[1] 李梦龙[2] 周大威[1] 黄俊[3] 

机构地区:[1]四川大学计算机学院,四川成都610065 [2]四川大学化学学院,四川成都610064 [3]华东师范大学计算中心,上海200062

出  处:《四川大学学报(工程科学版)》2011年第3期68-75,共8页Journal of Sichuan University (Engineering Science Edition)

基  金:国家自然科学基金资助项目(20972103;20905054)

摘  要:针对蛋白质相互作用的预测问题,提出了集成学习的方法。该方法使用人工神经网络和支持向量机为成员分类器的集成学习方法,并分别用自协方差编码方式和二肽组成来表示蛋白质序列的特征集合,预测的准确率和ROC曲线面积分别达到92.16%、94.38%和0.972 5、0.981 5。通过对成员分类器、集成学习方法以及集成学习方法之间的预测效果进行比较,结果表明,集成学习方法可获得更优的预测效果,并能有效提高预测精度,避免采样学习带来的不稳定性。To effectively predict the protein-protein interactions,an ensemble learning with artificial neural network and supporting vector machine as the individuals was used,and the feature selection of protein sequence was indicated by auto covariance and dipeptide composition.The prediction accuracy and AUC reached 92.16%,94.38% and 0.972 5,0.981 5,respectively.A comparison among artificial neural network,supporting vector machine and ensemble learning showed that the ensemble learning revealed more superior performance than the others and can improve the prediction accuracy while avoiding the instability of prediction caused by sampling learning.

关 键 词:集成学习 人工神经网络 支持向量机 蛋白质相互作用 

分 类 号:TP301[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象