基于改进FP-树的最大项目集挖掘算法  被引量:1

Maximum frequent itemsets mining algorithm based on improved FP-tree

在线阅读下载全文

作  者:谢志强[1] 朱孟杰[1] 杨静[2] 

机构地区:[1]哈尔滨理工大学计算机科学与技术学院,哈尔滨150080 [2]哈尔滨工程大学计算机科学与技术学院,哈尔滨150001

出  处:《计算机应用研究》2009年第2期502-505,共4页Application Research of Computers

基  金:国家自然科学基金资助项目(60673131,60873019);黑龙江省自然科学基金资助项目(F200608);黑龙江省教育厅海外学人重点科研基金资助项目(1152hq08)

摘  要:挖掘最大频繁项目集是多种数据挖掘应用中的关键问题。FP-growth算法是目前最有效的频繁模式挖掘算法之一,其在挖掘最大项目集时要递归生成大量的条件FP-树,存在时空效率不高的问题。于是结合改进的FP-树,提出了一种快速挖掘最大项目集的算法。该算法利用改进的FP-树是单向的且每个节点只保留指向父节点的指针,可以节约大量的存储空间;同时引入项目序列集和它的基本操作,使挖掘最大频繁项目集时不生成含大量候选项目的集合或条件FP-树,可以快速地挖掘出所有的最大频繁项目集。实例分析证明所提出的算法是可行的。Mining maximum frequent itemsets is a key problem in many data mining application.FP-growth algorithm is one of the most efficient frequent pattern mining methods.However,FP-growth algorithm must generate a huge number of conditional FP-trees recursively in processes of mining maximum frequent,so the efficiency of it unsatisfactory.This paper proposed an efficient mining maximum frequent algorithm,it unified the improvement FP-tree.The FP-tree was a one-way tree and there is no pointers to point its childre...

关 键 词:数据挖掘 关联规则 最大频繁项目集 频繁模式树 

分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象