基于FP-tree和支持度数组的最大频繁项集挖掘算法  被引量:2

Efficient mining maximal frequent itemsets by using FP-tree and support array

在线阅读下载全文

作  者:陈慧萍[1] 王建东[2] 叶飞跃[1] 王煜[2] 

机构地区:[1]南京航空航天大学信息科学与技术学院,江苏南京210016 [2]河海大学计算机信息工程学院,江苏常州2130221

出  处:《系统工程与电子技术》2005年第9期1631-1635,共5页Systems Engineering and Electronics

基  金:国家973计划基础研究发展基金(G1999032701);江苏省自然科学基金(BK2002091)资助课题

摘  要:提出了一个基于频繁模式树即FP-tree和支持度数组相结合的最大频繁项集挖掘算法,首先建立FP-tree,同时建立支持度数组,然后在此基础上建立最大频繁项集树MAXFP-tree,MAXFP-tree中包含了所有最大频繁项集,缩小了搜索空间,提高了算法的效率。算法分析和实验表明,该算法对稠密型数据集和稀疏型数据集均适用,并且特别适于挖掘具有长频繁项集的数据集。An efficient algorithm based on FP-tree and support array for mining maximal frequent iternsets is proposed. At first the FP-tree and the support array are created at the same time. Then a maximal frequent itemsets tree- MAXFP-tree is built up to store all the maximal frequent itemsets. Therefore, it can reduce the search space and improve the efficiency of the algorithm. The results of experiment show the algorithm can be applied to both dense datasets and sparse datasets and it is especially effective for mining the datasets with long frequent itemsets.

关 键 词:数据挖掘 FP-TREE MAXFP-tree 支持度数组 最大频繁项集 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象