基于分层聚类的并行数据预处理算法  被引量:2

Parallel Data Preprocessing Based on Hierarchical Clustering

在线阅读下载全文

作  者:李朝鹏[1] 李肯立[1] 

机构地区:[1]湖南大学计算机与通讯学院,湖南长沙410082

出  处:《微电子学与计算机》2007年第10期187-189,共3页Microelectronics & Computer

基  金:国家自然科学基金项目(60603053)

摘  要:分层聚类技术在图像处理、入侵检测和生物信息学等方面有着极为重要的应用,是数据挖掘领域的研究热点之一。针对目前并行分层聚类算法处理大数据集时速度较慢的特点,提出一种并行数据预处理算法,该算法可使原始输入数据的规模最多减少为原来的1/10,从而可减少总的并行分层聚类时间。在测试数据集上的实验结果表明使用本算法进行预处理后,能显著减少分层聚类的运行时间。Hierarchial clustering technology plays a very important role in image processing, intrusion detection and bioinformatics applications, which is one of the most extensively studied branch in data mining. Presently the parallel hierarchical algorithms aren't very good at processing large data. To overcome this shortcoming, a new parallel data preprocessing algorithm based on Hierarchical Clustering is proposed in this paper. This algorithm can reduce the scale of data and runtime accounting for one tenth of it in the best situation. The experiment shows the effectiveness of our algorithm.

关 键 词:分层聚类 并行算法 预处理 

分 类 号:TP338.6[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象