基于云计算的SLIQ并行算法研究  被引量:6

Research on the SLIQ Parallel Algorithm Based on Cloud Computing

在线阅读下载全文

作  者:杨长春[1] 沈晓玲[1] 

机构地区:[1]常州大学信息科学与工程学院,江苏常州213164

出  处:《计算机工程与科学》2012年第3期62-66,共5页Computer Engineering & Science

基  金:国家自然科学基金资助项目(61003163);江苏省科技基金资助项目(BZ2010021)

摘  要:云计算为存储和分析海量数据提供了高效的解决方案,对数据挖掘算法的研究具有重要的理论意义和应用价值。SLIQ算法采用逐一遍历并计算伸缩性指标的方法来寻找最佳分裂点,这种方法过于消耗时间,当数据量增大时,算法的执行效率很低。本文针对云计算环境下的决策规则挖掘算法展开研究,介绍了Map Reduce编程模型,在此基础上,以实现云计算环境下SLIQ并行化挖掘为目的,给出了改进后的SLIQ算法在Map Reduce编程模型上的应用过程。Cloud computing provides efficient solutions to storing and analyzing mass data.It is very important to study the data mining algorithms based on cloud computing from the theoretical viewpoint and the practical viewpoint.The SLIQ algorithm finds the best split point through calculating the scalability indexes one by one.When the amount of data increases,the method is time-consuming,and the efficiency of the algorithm is very low.In this paper,the algorithms of mining decision rules based on the cloud computing environment are focused on the MapReduce programming model.On the basis,an improved SLIQ algorithm as well as the procedure of the improved SLIQ algorithm on MapReduce is designed in order to realize parallel data mining.

关 键 词:云计算 SLIQ MAPREDUCE 数据挖掘 

分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象