一种基因数据的聚类并行算法研究  被引量:1

A Study on Parallel Algorithm of the Gene Expression Data Clustering Analysis

在线阅读下载全文

作  者:毛韶阳[1] 李肯立[2] 

机构地区:[1]湖南人文科技学院数学系,湖南娄底417000 [2]湖南大学计算机与通信学院,湖南长沙410082

出  处:《微电子学与计算机》2007年第9期130-133,共4页Microelectronics & Computer

基  金:国家自然科学基金项目(60603053);教育部重点项目(105128)

摘  要:提出了一种基于密度的聚类并行算法,在APRAM模型的分布式存储系统中,通过欧几里德距离矩阵和密度函数两次时间复杂度为O(n2)的计算,可使聚类过程的时间复杂度变为O(n),以增加一次计算的代价来降低聚类过程的时间复杂度。基于8结点的机群计算实验表明本算法能够达到较同类算法更高的并行加速比,能提高高维生物数据的聚类速度。Put forward a clustering parallel algorithms based on the density. Use MPI under the APRAM model, passing twice computing with time complexity is O(n2) that of the Euclidean distance matrix and the density function, can make the time complexity of clustering procedure be 0 (n), reduce the time complexity of clustering through adding once computing. The experiment based on eight nodes indicates that this algorithm can attain higher parallel accelerate ratic than the same kind algorithm, raise the clustering rate of the high dimension living data.

关 键 词:并行算法 APRAM模型 聚类分析 密度函数 时间复杂度 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象