基于距离测定的蛋白质复合物识别算法  被引量:7

Distance measure-based algorithm for identification of protein complexes

在线阅读下载全文

作  者:李敏[1] 王建新[1] 陈建二[1] 

机构地区:[1]中南大学信息科学与工程学院,长沙410083

出  处:《吉林大学学报(工学版)》2010年第5期1318-1323,共6页Journal of Jilin University:Engineering and Technology Edition

基  金:国家自然科学基金重点项目(60433020);'973'国家重点基础研究发展规划项目(2008CB317107);高等学校博士学科点专项科研基金项目(20090162120073);新世纪优秀人才支持计划项目(NCET-05-0683);长江学者和创新团队发展计划项目(IRT0661);中南大学自由探索计划项目(201012200124)

摘  要:针对蛋白质相互作用网络聚类算法标识已知蛋白质复合物数量有限的问题,提出了一种新的基于距离测定的蛋白质复合物识别算法IPC-DM。该算法基于对已知复合物内蛋白质之间的最短距离一般不超过2的发现,利用新的种子-扩充模型,大大提高了识别蛋白质复合物的准确性。基于酵母蛋白质相互作用网络的实验表明,算法IPC-DM较其他5种典型的蛋白质复合物识别算法MCODE、RNSC、CFinder、LCMA和DPClus具有更好的蛋白质复合物识别能力。The number of known complexes recalled by the existing algorithms of clustering in protein-protein interaction network is very limited. To solve this problem, a new distance measure-based algorithm for identification of protein complexes, named IPC-DM, is proposed based on our discovery that most of the shortest paths between proteins complexes are no more than two. A new seed-extension model is also proposed to improve the precision of protein complexes discovery. Experiment results on yeast protein interaction network show that more known protein complexes are recalled by IPC-DM than by other typical algorithms: MCODE, ENSC, CFinder, LCMA and DPClus.

关 键 词:计算机应用 蛋白质相互作用网络 蛋白质复合物 聚类算法 

分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象