一种新型快速建立频繁模式树的方法  被引量:2

New frequent pattern tree structure

在线阅读下载全文

作  者:王静红[1] 刘教民[1] 郭盛[2] 孙亚非[3] 

机构地区:[1]河北工业大学智能电器研究所,天津050054 [2]石家庄学院外语学院,石家庄050035 [3]河北师范大学信息技术学院,石家庄050091

出  处:《计算机应用》2008年第3期735-737,共3页journal of Computer Applications

基  金:国家自然科学基金资助项目(60675014);河北省科技厅项目(042135126);河北省教育厅自然基金资助项目(2007474)

摘  要:频繁模式树(FP_tree)是产生频繁相集的有效方法,现在的算法一般都是基于频繁模式树,但是创建FP_tree需要花费很长时间。为了提高创建树的效率,提出了一种新型快速的方法——改进的层次频繁模式树(IHFP_tree)。首先,扫描一遍数据库,产生每个项的等价类;其次,去掉不频繁项后,对等价类进行重新改写,然后创建FP_tree。提出只需扫描一遍数据库,而且不需要筛选和重组事务记录的方法,有效提高了算法的时空效率。实验表明,IHFP_tree的挖掘速度比FP_tree方法要快得多。FP_tree is an efficient algorithm for mining frequent itemsets. Many algorithms proposed recently are based on FP_tree. But the FP_tree construction may cost much time, moreover, it needs to scan database twice. In order to improve the efficiency of constructing the FP_tree, a new fast algorithm called Inprove Hierarchy FP_tree (IHFP_tree) was proposed. The algorithm contained two main parts. The first was to scan the database only once for generating equivalence classes of each item. The second was to delete the non-frequent items and rewrite the equivalence classes of the frequent items, and then construct the IH FP_tree.

关 键 词:频繁模式树 改进的层次频繁模式树 频繁模式 等价类 

分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象