一种用于蛋白质结构聚类的聚类中心选择算法  被引量:7

An Exemplar Selection Algorithm for Protein Structures Clustering

在线阅读下载全文

作  者:黄旭[1] 吕强[1,2] 钱培德[1,2] 

机构地区:[1]苏州大学计算机科学与技术学院,苏州215006 [2]江苏省计算机信息处理技术重点实验室,苏州215006

出  处:《自动化学报》2011年第6期682-692,共11页Acta Automatica Sinica

基  金:国家自然科学基金(60970055)资助~~

摘  要:提出一种对蛋白质结构聚类中心进行选择的算法.聚类是蛋白质结构预测过程中必不可少的一个后处理步骤,而目前在蛋白质结构预测中常用的属性阈值(Quality threshold,QT)聚类算法依赖于由经验得出的聚类半径;其他聚类算法,如近邻传播(Affinity propagation,AP)聚类算法也存在影响聚类分布的参数.为克服对主观经验参数的依赖,本文提出一种聚类中心选择算法(Exemplar selection algorithm,ESA),用于对不同参数下的聚类结果进行分析,从而选择最佳聚类中心,进而确定聚类半径等经验参数.该算法在真实蛋白质结构数据集上进行了实验,在未知经验参数情况下选择出最佳聚类中心,同时也为不同聚类算法寻找适合相应数据集的客观聚类参数提供了支持.This paper proposes an exemplar selection algorithm(ESA)for protein structures clustering,which is a necessary post-processing step for protein structure prediction.The widely-used quality threshold(QT)algorithm in protein structure prediction depends on clustering radius derived from experience,which also affects clustering distribution in other widely-used clustering algorithms such as affinity propagation(AP).The proposed exemplar selection algorithm can analyze clustering results,choose the best exemplar,and confirm clustering parameter such as clustering radius. Experimental results on real protein structure predictions confirm the effectiveness of our exemplar selection algorithm, which can choose the best exemplar with no experience parameter,and can find the best parameter fitting for data set.

关 键 词:蛋白质结构 聚类 属性阈值 近邻传播 聚类中心选择 

分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象