检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]河北工业大学控制科学与工程学院,天津300130
出 处:《中南民族大学学报(自然科学版)》2016年第3期102-106,共5页Journal of South-Central University for Nationalities:Natural Science Edition
基 金:天津市科技支撑资助项目(14ZCDZGX00818)
摘 要:针对目前海量数据挖掘过程中存在着频繁项集挖掘效率低、冗余项集繁多的问题,提出了改进的频繁模式树和遗传算法(FPGA),该算法鉴于异构数据的差异性特征,采用改进的频繁模式树和基于MapReduce的并行遗传算法搜索最大频繁项集,缩小了搜索范围,提高了挖掘效率.实验结果表明:该算法在时间复杂度方面有了很大提高,与传统的FP_Growth算法相比,具有更好的加速比以及更高的执行效率.Since efficiency and accuracy of mining frequent itemsets is not very high in mass data, an improved FPGA algorithm was proposed for mining them. According to the feactures of the mass data,the improved FP _ Growth mines frequent itemsets and the parallel genetic algorithm was employed to search for the largest frequent patterns. FPGA althorithm sharnk the scope to improve the efficiency of the mining results. Experiments show that the FPGA althorithm is superior to the original one due to the high efficiency and speedup.
关 键 词:遗传算法 云计算 FP_GROWTH算法 最大频繁项集
分 类 号:TP3[自动化与计算机技术—计算机科学与技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.193