基于格的快速频繁项集挖掘算法  被引量:2

Lattice-based Algorithm for Fast Mining Frequent Itemsets

在线阅读下载全文

作  者:刘彩苹[1] 毛建频[2] 毛建旭[3] 屈卫兰[1] 蔡玉武 

机构地区:[1]湖南大学信息科学与工程学院,湖南长沙410082 [2]抚州职业技术学院信息工程系,江西抚州344000 [3]湖南大学电气与信息工程学院,湖南长沙410082

出  处:《湖南大学学报(自然科学版)》2013年第10期52-57,共6页Journal of Hunan University:Natural Sciences

基  金:国家自然科学基金资助项目(61072121);湖南省自然科学基金资助项目(12JJ2035);'中央高校基本科研业务费'资助项目

摘  要:随着数据库规模的增加或支持度阈值的减少,频繁模式的数量将以指数形式增长,FP-growth算法运行的时空效率将大为降低.本文提出一种基于格的快速频繁项集挖掘算法LFP-growth,算法利用等价关系将原来的搜索空间(格)划分成若干个较小的子空间(子格),通过子格间的迭代分解,将对网格P(I)的频繁项集挖掘转化为对多个子格的并集进行的约束频繁项集挖掘.实验结果和理论分析表明,在挖掘大型数据库时,LFP-growth算法的时间和空间性能均优于FP-growth算法.Along with the increasing size of database and the reduction of support threshold,the number of frequent patterns will grow exponentially,and the time and space efficiency of the FP-growth algorithm will greatly reduce.The cause of low efficiency was analyzed,and according to the analysis,a lattice-based algorithm for fast mining frequent itemsets (LFP-growth) was presented.The proposed algorithm divided a large lattice into many sub-lattices by using equivalence relation.Through iterativing decomposition of sublattices,frequent itemset mining in lattice was transformed into frequent itemsets mining in a union set of multiple sublattices.Experiments have shown that the time and space performance of LFP-growth algorithm is superior to that of FP-growth algorithm in mining large database.

关 键 词:数据挖掘 FP-树 频繁项集  

分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象