基于随机游走的蛋白质功能预测算法设计与实现  被引量:2

Prediction of protein function based on random walk algorithm design and implementation

在线阅读下载全文

作  者:马吉权[1] 贾翠翠[1] 张军杰 

机构地区:[1]黑龙江大学计算机科学技术学院,哈尔滨150080 [2]山东航天电子技术研究所,山东烟台264670

出  处:《黑龙江大学工程学报》2015年第3期73-78,共6页Journal of Engineering of Heilongjiang University

基  金:黑龙江省自然科学基金资助项目(F201248)

摘  要:在构建蛋白质相互作用网络时从通路数据出发,利用通路数据整合蛋白质相互作用网络。提出了一个基于随机游走的蛋白质功能预测方法,在该算法中把已知功能的蛋白质当作起始点,对于随机游走在蛋白质互作网络中产生的邻居信息,转换为注释模式信息,并根据已知功能的蛋白质的功能来提取未知功能蛋白质的注释模式。利用传统的K近邻算法从训练样本集中找到未知功能蛋白质的k个最近邻。最后,结合多标签分类的K近邻算法,统计k个近邻中蛋白质的功能类数目,基于最大后验概率预测未知功能蛋白质属于的功能标签类。通过在构建蛋白质互作网络进行实验,结果表明提出的方案能够有效地进行蛋白质功能预测。In the process of constructing the protein-protein interaction network is starting from the pathway data, data integration using pathway of protein interaction networks. A prediction method for protein function is presented based on random walk, in this algorithm, the proteins of known function as a starting point is provided, for the random walk in the protein interaction network of neighborhood information, annotation schema information is converted, and according to the known function protein function to extract the unknown function protein annotation mode. After, using the traditional KNN algorithm to find the unknown function protein the k nearest neighbors from the training set. Last, combined with KNN algorithm for multi label classification, the maximum posteriori probability prediction function label unknown function protein is based. The experiments in which we construct protein interaction network, the results show that the proposed scheme can predict the protein function effectively.

关 键 词:蛋白质功能预测 蛋白质-蛋白质相互作用网络 随机游走 蛋白质功能注释 K近邻 多标签分类 

分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象