基于FP树的一种快速挖掘生成器算法  被引量:3

A fast Mining Generator Algorithm Based on FP Tree

在线阅读下载全文

作  者:许普乐[1] 张勤[2] 纪允[3] 

机构地区:[1]芜湖职业技术学院,安徽芜湖241006 [2]安徽林业职业技术学院,安徽合肥230031 [3]合肥工业大学,安徽合肥230009

出  处:《安庆师范学院学报(自然科学版)》2013年第1期48-53,77,共7页Journal of Anqing Teachers College(Natural Science Edition)

基  金:安徽省教学研究项目(20101259)资助

摘  要:频繁项集挖掘是数据挖掘的一个热点,频繁项集的精简表示有助于减少频繁项集的数量,是频繁项集挖掘中的一个关键性问题。文章在总结频繁项集的相关精简模型后,对频繁项集精简模型,生成器精简表示模型进行研究。传统的生成器精简表示模型每次生成都需要扫描数据库,效率不高。本文提出一种新颖的频繁项集精简算法FPASCAL,使用FP树数据结构代替数据库再结合剪枝策略。理论分析及实验证明该方法在时间性能和空间复杂度上都优于传统方法。Frequent itemset mining is a very hot topic in data mining. The concise representation of frequent itemset is a key problem, as it can reduce the frequent itemset numbers without information less. After summarizing related frequent itemset concise representation models , we research a frequent itemset concise model and its generator representation. While the traditional genera- tor representation need scanning database which makes it low efficient, a new frequent itemset concise representation FPASCAL al- gorithm is put forwarded , after using FP tree instead of data base and combine some pruning strategy. The experiment result proves that the FPASCAL algorithm is more better than the traditional algorithm both time consuming and space consuming.

关 键 词:频繁项集 数据挖掘 精简表示 生成器 FP树 

分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象