检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:申德荣[1] 姜安琦[1] 王广奇[1] 杨柄恒[1] 于戈[1]
机构地区:[1]东北大学信息科学与工程学院,辽宁沈阳110004
出 处:《小型微型计算机系统》2007年第8期1419-1422,共4页Journal of Chinese Computer Systems
基 金:国家自然科学基金项目(60673139;60573090)资助;国家"八六三"项目(2003AA414210)资助
摘 要:基于数据挖掘的数据可视化是将大数据量展示给用户的一种有效手段.在EFCS-Grid中,基于特定属性的k-平均聚类分析算法进行聚类分析,之后将聚类结果展示给用户.本文通过实验测试并分析了多用户下的采用服务器进行聚类分析的时间代价以及EFCS-Grid系统在不同压力情况下的数据处理的总时间代价,得出了聚类分析在系统的数据处理过程中占重要比重,并随着数据量和并发用户数的增加,系统的性能急剧下降.为此,本文结合P2P体系结构,提出了采用分布式聚类分析数据的处理策略,并将数据处理分为数据合成层和数据分析层.由数据合成层实现数据的整合,保证合成后的数据满足用户的模式需求,之后,在相同模式的基础上实现数据的一次聚类分析和二次聚类分析,达到了通过利用P2P的分布计算能力,缓解集中处理瓶颈和提高网格内数据处理的效率的目的.Data visualization by means of data mining is an effective method for presenting an amount of data to users. In EFCS-Grid, data are clustered by using k-mean based on given attributes, then to present the result to users. This paper tests and analyzes the time cost of data clustering analysis implementing at centralized server in case of multi-users, and the total time cost of data processing in EFCS-Grid in different conditions, and draw an conclusion that the time cost of data clustering analysis is more important in that of data process in EFCS-Grid, and the performance of the grid system will become lower greatly with the data amount processed increasing. Thus a distributed clustering analysis strategy is proposed by means of P2P structure, in which data integration layer and data clustering layer are included, the former one integrates the partial data into a complete schema on users demand,then to implement two times data clustering analysis to reach the purposes of easing the deficiency of centralized clustering analysis and improving the efficiency of data clustering by using the distributed computing capability of P2P structure.
分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222