新型频繁项集快速挖掘模式树的方法  

Research on new mining algorithm of frequent itemset

在线阅读下载全文

作  者:王静红[1] 刘丽娜[2] 耿宗科[1] 

机构地区:[1]河北师范大学信息技术学院,石家庄050091 [2]河北农业大学,河北秦皇岛066004

出  处:《计算机应用研究》2008年第8期2325-2327,共3页Application Research of Computers

基  金:国家自然科学基金资助项目(60675014);河北省科技厅资助项目(042135126);河北省教育厅自然科学基金资助项目(2007474)

摘  要:在FP_growth算法中,FP_tree及条件FP_tree的构造和遍历占了算法绝大部分的时间,为了能减少这方面的时间,提出了一种新型快速的方法——改进的层次频繁模式树(inproved hierarchy FP_tree,IHFP_tree)。该方法采用首先对数据库扫描一遍,产生每个项的等价类;然后去掉不频繁项,对等价类进行重新改写;最后再创建FP_tree。引入层次频繁模式的概念,在挖掘过程中大大提高了算法的时空效率。与其他频繁模式挖掘的常用算法进行了时间复杂度和空间复杂度的比较,实验表明,IHFP_tree的挖掘速度比FP_tree方法要快得多。In FP-growth algorithm, it costs most of the time in constructing and traversing the FP-tree and conditional FP-tree. In order to constructing the FP_tree efficiently, this paper proposed a new fast algorithm called inproved hierarchy FP_tree (abbreviate IHFP_tree). The algorithm firstly scaned the database only once for generating equivalence classes of each item. Then deleted the non-frequent items and rewrote the equivalence classes of the frequent items, and then constructed the IH FP_tree.

关 键 词:FP_tree IHFP_tree 频繁模式 等价类 

分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象