基于 Hadoop的Apriori算法与实现  被引量:10

Research on Apriori algorithm and implementation of Hadoop platform

在线阅读下载全文

作  者:孙赵旭 谢晓兰[1,2] 周国清[2] 倪金生[2] 胡莘[2] 

机构地区:[1]桂林理工大学 信息科学与工程学院 [2]桂林理工大学 广西空间信息与测绘重点实验室,广西桂林541004

出  处:《桂林理工大学学报》2014年第3期584-588,共5页Journal of Guilin University of Technology

基  金:国家高技术研究发展计划项目(2013AA12A402);广西自然科学基金项目(2013jjAA70124);广西空间信息与测绘重点实验室基金项目(桂科能1103108-25;桂科能1207115-13)

摘  要:针对传统Aprion数据挖掘算法平台的硬件瓶颈以及算法运算耗时、需要重复扫描数据库等缺点,提出了一种基于Hadoop平台应用MapReduce模型与Hbase,对Apriori进行云端的迁移和优化的算法,并与其他的改进Apriori算法进行了分析与比较。实验结果表明:新的云端算法降低了时间复杂度,使其可以更好的进行数据处理。Traditional Apriori algorithm,one of the most common algorithms for data mining,has two shortcom-ings:time-consuming and repeating scanning database.This paper presents the improvement of the Apriori algo-rithm through combining MapReduce model and Hbase under the Hadoop operating platform.The paper analyzes and compares other improved Apriori algorithm with our algorithm.The improved method is experimented under cloud and optimization test.The experimental results demonstrate that the improved algorithm can largely avoid the time-consuming,and make better data operation.

关 键 词:数据挖掘 云计算 

分 类 号:TP393[自动化与计算机技术—计算机应用技术] TP311.13[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象