一种基于广义相似性的共调控基因聚类算法  被引量:1

A Clustering Algorithm Based on Generalized Similarity for Co-regulated Genes

在线阅读下载全文

作  者:赵宇海[1,2] 乔百友[1,2] 林天亮[3] 王国仁[1,2] 

机构地区:[1]东北大学医学影像计算教育部重点实验室,辽宁沈阳110004 [2]东北大学信息科学与工程学院,辽宁沈阳110004 [3]东北大学计算中心,辽宁沈阳110004

出  处:《东北大学学报(自然科学版)》2009年第11期1558-1561,共4页Journal of Northeastern University(Natural Science)

基  金:国家自然科学基金资助项目(60803026;60873011;60773219);教育部博士学科点新教师基金资助项目(20070145112);教育部重大培育项目(706016);国家重点基础研究发展计划项目(2007AA01Z192)

摘  要:针对共调控基因的特殊性质和现有共调控基因聚类算法存在的不足,提出了基于广义相似性的聚类模型g-Cluster.正负共调控基因因具有相同的编码而被聚集到同一个共调控基因簇中.进一步提出了一种基于树结构的聚类算法FBTD,采用先宽度优先后深度优先的搜索策略,挖掘所有符合条件的最大g-Cluster,同时应用了高效的削减规则和优化策略.将该算法用于真实数据集.理论分析和实验结果都表明,该算法是实用和有效的.A novel clustering model, i.e., the g-Cluster, is developed on the basis of generalized similarity for the special properties and disadvantages of existing clustering algorithms of co- regulated genes. The positive and negative co-regulated genes in this model are integrated into the same cluster if and only if they are provided with the same code. Further, a tree-based clustering algorithm FBTD(first breadth then depth) is proposed, where the priorities in search strategy is that the breadth is taken first then the depth, to find out all the maximal g-Clusters with high- efficiency pruning rules and optimizing strategy performed simultaneously. Applying the FBTD algorithm to real datasets involving genes, both the theoretic and testing results showed that the algorithm is practically efficient.

关 键 词:共调控基因 聚类 模式相似性 基因本体 

分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象