EFCS-Grid内基于P2P的分布聚类分析处理策略的研究  

Study on Distributed Clustering Analysis Processing Strategy Based on P2P in EFCS-Grid

在线阅读下载全文

作  者:申德荣[1] 姜安琦[1] 王广奇[1] 杨柄恒[1] 于戈[1] 

机构地区:[1]东北大学信息科学与工程学院,辽宁沈阳110004

出  处:《小型微型计算机系统》2007年第8期1419-1422,共4页Journal of Chinese Computer Systems

基  金:国家自然科学基金项目(60673139;60573090)资助;国家"八六三"项目(2003AA414210)资助

摘  要:基于数据挖掘的数据可视化是将大数据量展示给用户的一种有效手段.在EFCS-Grid中,基于特定属性的k-平均聚类分析算法进行聚类分析,之后将聚类结果展示给用户.本文通过实验测试并分析了多用户下的采用服务器进行聚类分析的时间代价以及EFCS-Grid系统在不同压力情况下的数据处理的总时间代价,得出了聚类分析在系统的数据处理过程中占重要比重,并随着数据量和并发用户数的增加,系统的性能急剧下降.为此,本文结合P2P体系结构,提出了采用分布式聚类分析数据的处理策略,并将数据处理分为数据合成层和数据分析层.由数据合成层实现数据的整合,保证合成后的数据满足用户的模式需求,之后,在相同模式的基础上实现数据的一次聚类分析和二次聚类分析,达到了通过利用P2P的分布计算能力,缓解集中处理瓶颈和提高网格内数据处理的效率的目的.Data visualization by means of data mining is an effective method for presenting an amount of data to users. In EFCS-Grid, data are clustered by using k-mean based on given attributes, then to present the result to users. This paper tests and analyzes the time cost of data clustering analysis implementing at centralized server in case of multi-users, and the total time cost of data processing in EFCS-Grid in different conditions, and draw an conclusion that the time cost of data clustering analysis is more important in that of data process in EFCS-Grid, and the performance of the grid system will become lower greatly with the data amount processed increasing. Thus a distributed clustering analysis strategy is proposed by means of P2P structure, in which data integration layer and data clustering layer are included, the former one integrates the partial data into a complete schema on users demand,then to implement two times data clustering analysis to reach the purposes of easing the deficiency of centralized clustering analysis and improving the efficiency of data clustering by using the distributed computing capability of P2P structure.

关 键 词:分布聚类分析 P2P 可视化 数据库网格 

分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象