一种改进的谱聚类算法及其在基因表达谱分析中的应用  被引量:2

An improved spectral clustering algorithm and its application in gene expression profile analysis

在线阅读下载全文

作  者:葛芳[1] 王年[1] 郭秀丽[2] 

机构地区:[1]安徽大学计算智能与信号处理教育部重点实验室,安徽合肥230039 [2]山东省信息中心,山东济南250011

出  处:《安徽大学学报(自然科学版)》2012年第5期67-72,共6页Journal of Anhui University(Natural Science Edition)

基  金:国家自然科学基金资助项目(60772121);安徽省自然科学基金资助项目(1208085MF93);安徽大学"211工程"学术创新团队基金资助项目(KJTD007A)

摘  要:聚类分析是从基因表达谱数据中提取生物医学信息的主要方法之一.针对传统谱聚类算法无法确定聚类个数的问题,提出一种改进的谱聚类算法并将其应用于基因表达谱聚类分析.首先用基因表达谱数据构造Laplacian矩阵,经特征值分解后得到相应的特征值和特征向量,用谱隙来描述相邻特征值的差值;然后通过寻找谱隙序列的最大值来确定聚类个数;最后从单位化的特征向量着手实现数据类别的划分.通过模拟数据与癌症数据的实验,证明了该文算法的有效性.Cluster analysis is one of the main methods for extracting biomedical information from gene expression profile datas. To dispose of the problem that traditional spectral clustering algorithm could not determine the clustering number, an improved spectral clustering algorithm was proposed and it was applied in the cluster analysis of gene expression profile datas. This'~ algorithm first constructed normalized laplacian matrix with gene expression profile datas and obtained the corresponding eigenvalues and eigenvectors through eigenvalue decomposition. The difference between the adjacent eigenvalues was described with eigengap. Then, the clustering number was determined by searching the maximum of eigengap sequence. Finally, the clustering problem was solved by directly using unit eigenvector. The experiments on simulation data and cancer data demonstrated the validity of this algorithm.

关 键 词:谱聚类 谱隙 LAPLACIAN矩阵 基因表达谱 

分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象