基于FC-tree的频繁闭项目集挖掘算法  被引量:1

Algorithm Based on FC-tree for Mining Frequent Closed Itemsets

在线阅读下载全文

作  者:任永功[1] 张亮[1] 付玉[1] 吕君义[2] 

机构地区:[1]辽宁师范大学计算机与信息技术学院,大连116029 [2]辽河油田锦州工程技术处,凌海121209

出  处:《计算机科学》2008年第9期149-152,164,共5页Computer Science

基  金:国家自然科学基金项目(60603047;60703068);辽宁省自然科学基金;辽宁省教育厅高等学校科研基金;大连市优秀青年科技人才基金

摘  要:目前提出的频繁项目集挖掘算法大多基于Apriori算法思想,但这类算法会产生巨大的候选集并且重复扫描数据库。本文针对这一问题,给出了一种基于FC-tree的频繁闭项目集挖掘算法Max-FCIA,该算法将频繁项目集存储在哈希表中,节省了程序的搜索时间。此外,利用广度优先搜索和有效的剪枝策略,大大限制了候选项目集的生成,缩小了搜索空间从而提高了程序的性能。实验结果表明该算法是快速有效的。Most mining algorithms of frequent Itemsets are based on Apriori. However, these algorithms make huge candidate itemsets and scan large database again and again. In order to solve this problem, an efficient algorithm called Max-FCIA based on FC-tree for mining frequent closed itemsets is proposed. The algorithm stores frequent Itemsets in hash table, which reduce the searching time. By breadth first search strategy and efficient pruning methods, making the frequent closed itemsets restrains the number of candidate, which saves the space and improves the efficiency of algorithm.

关 键 词:频繁项目集 频繁闭项目集 最小频繁闭项目集 最大频繁闭项目集 FC-tree(频繁闭模式树) 

分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论] TN405[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象