基于回溯的最大频繁项集挖掘算法  

Mining Maximal Frequent Itemsets Based on Back Track

在线阅读下载全文

作  者:张心静 于嘉威 王红梅[1] 

机构地区:[1]长春工业大学计算机科学与工程学院,吉林长春130012

出  处:《电子科技》2016年第8期78-81,共4页Electronic Science and Technology

基  金:国家自然科学基金资助项目(61133011);吉林省教育厅"十二五"科学技术研究基金资助项目(2013431)

摘  要:针对Apriori类算法多次扫描数据库和FP-tree类算法需要构建大量条件模式树的问题,文中提出了挖掘最大频繁项集的GBMFI算法。采用垂直格式存储事务数据库,以枚举树为基础,利用子集非频繁性质和父子节点支持度信息在搜索过程中对枚举树进行剪枝,最终得到最大频繁项集。通过实验对比,结果证明了算法的有效性,尤其适用于稀疏数据集。In view of the fact that Apriori algorithms scans the database multiple times and the FP - tree algo- rithms requires build a large number of conditional trees, the GBMFI algorithm is proposed for mining maximal fre- quent itemsets. The transaction database is stored in vertical format. Based on the enumeration tree, the GBMFI algo-rithm performs the pruning operation to narrow the search space with the properties of non-frequent subsets and the support information of the node to get maximal frequent item sets. Experiments demonstrate the effectiveness of the GBMFI, especially for spares data sets.

关 键 词:数据挖掘 最大频繁项集 关联规则 回溯法 剪枝 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象