基于云计算的最大频繁项集挖掘算法  被引量:2

Mining Maximal Frequent Itemsets Based on Cloud Computing

在线阅读下载全文

作  者:孙鹤旭[1] 孙泽贤[1] 林涛[1] 

机构地区:[1]河北工业大学控制科学与工程学院,天津300130

出  处:《中南民族大学学报(自然科学版)》2016年第3期102-106,共5页Journal of South-Central University for Nationalities:Natural Science Edition

基  金:天津市科技支撑资助项目(14ZCDZGX00818)

摘  要:针对目前海量数据挖掘过程中存在着频繁项集挖掘效率低、冗余项集繁多的问题,提出了改进的频繁模式树和遗传算法(FPGA),该算法鉴于异构数据的差异性特征,采用改进的频繁模式树和基于MapReduce的并行遗传算法搜索最大频繁项集,缩小了搜索范围,提高了挖掘效率.实验结果表明:该算法在时间复杂度方面有了很大提高,与传统的FP_Growth算法相比,具有更好的加速比以及更高的执行效率.Since efficiency and accuracy of mining frequent itemsets is not very high in mass data, an improved FPGA algorithm was proposed for mining them. According to the feactures of the mass data,the improved FP _ Growth mines frequent itemsets and the parallel genetic algorithm was employed to search for the largest frequent patterns. FPGA althorithm sharnk the scope to improve the efficiency of the mining results. Experiments show that the FPGA althorithm is superior to the original one due to the high efficiency and speedup.

关 键 词:遗传算法 云计算 FP_GROWTH算法 最大频繁项集 

分 类 号:TP3[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象