基于改进FP-tree的最大频繁项集挖掘算法  被引量:14

Algorithm for mining maximal frequent itemset based on improved FP-tree

在线阅读下载全文

作  者:陈晨[1,2] 鞠时光[1] 

机构地区:[1]江苏大学计算机科学与通信工程学院,江苏镇江212013 [2]江苏财经职业技术学院,江苏淮安223001

出  处:《计算机工程与设计》2008年第24期6236-6239,共4页Computer Engineering and Design

基  金:国家自然科学基金项目(60773049);江苏省自然科学基金项目(BK2006073)

摘  要:现有的最大频繁项集挖掘算法在挖掘过程中需要进行超集检测,基于FP-tree的算法需要递归的建立条件频繁模式树,挖掘效率不高。提出了一种基于改进FP-tree高效挖掘最大频繁项集的算法(MMFI)。该算法修改了FP-tree结构并采用NBN策略,在挖掘过程中既不需要进行超集检测也不需要递归的建立条件频繁模式树。算法分析和实验结果表明,该算法是一种有效、快速的算法。The present algorithms for mining maximal frequent itemset have to do superset checking, and some of them using FP-tree have to construct conditional frequent pattern trees recursively, as to make them inefficient. A new algorithm MMFI (mining maximal frequent itemset) for efficiently mining maximal frequent itemset based on improved FP-tree is proposed. In the algorithm neither superset checking nor constructing conditional frequent pattern tree recursively is needed through modifying the structure of FP-tree and adopting a new method called NBN (node by node). It is proved by theoretical analysis and experimental comparison that the algorithm is fast and efficient.

关 键 词:数据挖掘 关联规则 最大频繁项集 超集检测 频繁模式树 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象