基于格的快速频繁项集挖掘算法被引量：2

Lattice-based Algorithm for Fast Mining Frequent Itemsets

作　　者：刘彩苹[1] 毛建频[2] 毛建旭[3] 屈卫兰[1] 蔡玉武

机构地区：[1]湖南大学信息科学与工程学院,湖南长沙410082 [2]抚州职业技术学院信息工程系,江西抚州344000 [3]湖南大学电气与信息工程学院,湖南长沙410082

出　　处：《湖南大学学报（自然科学版）》2013年第10期52-57,共6页Journal of Hunan University:Natural Sciences

基　　金：国家自然科学基金资助项目(61072121);湖南省自然科学基金资助项目(12JJ2035);'中央高校基本科研业务费'资助项目

摘　　要：随着数据库规模的增加或支持度阈值的减少,频繁模式的数量将以指数形式增长,FP-growth算法运行的时空效率将大为降低.本文提出一种基于格的快速频繁项集挖掘算法LFP-growth,算法利用等价关系将原来的搜索空间(格)划分成若干个较小的子空间(子格),通过子格间的迭代分解,将对网格P(I)的频繁项集挖掘转化为对多个子格的并集进行的约束频繁项集挖掘.实验结果和理论分析表明,在挖掘大型数据库时,LFP-growth算法的时间和空间性能均优于FP-growth算法.Along with the increasing size of database and the reduction of support threshold,the number of frequent patterns will grow exponentially,and the time and space efficiency of the FP-growth algorithm will greatly reduce.The cause of low efficiency was analyzed,and according to the analysis,a lattice-based algorithm for fast mining frequent itemsets （LFP-growth） was presented.The proposed algorithm divided a large lattice into many sub-lattices by using equivalence relation.Through iterativing decomposition of sublattices,frequent itemset mining in lattice was transformed into frequent itemsets mining in a union set of multiple sublattices.Experiments have shown that the time and space performance of LFP-growth algorithm is superior to that of FP-growth algorithm in mining large database.

关键词：数据挖掘 FP-树频繁项集格

分类号：TP311.13[自动化与计算机技术—计算机软件与理论]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于格的快速频繁项集挖掘算法被引量：2

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于格的快速频繁项集挖掘算法 被引量：2

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

基于格的快速频繁项集挖掘算法被引量：2