基于静态IS-树的频繁模式挖掘  

Mining Frequent Patterns Based on Static IS-Tree

在线阅读下载全文

作  者:马海兵[1] 张锦[2] 范颖杰[2] 胡运发[2] 

机构地区:[1]复旦大学信息科学与工程学院 计算机与信息技术系,上海200433 [2]复旦大学信息科学与工程学院计算机与信息技术系,上海200433

出  处:《模式识别与人工智能》2005年第6期664-669,共6页Pattern Recognition and Artificial Intelligence

基  金:国家自然科学基金(No.60173027);国家863高技术研究发展计划基金(No.2001AA115020)

摘  要:提出一种基于静态IS-树的频繁模式挖掘有效算法IS-mine,并与经典的Apriori算法和FP-growth算法进行了实验比较。算法直接构造频繁项集,不进行Apriori算法采用的代价较高的候选集产生与测试操作。算法采用深度优先,模式增长的策略,挖掘任务只在一棵静态的IS-树上进行,避免了FP-growth算法所采用的代价较高的动态树的构建。针对不同特征数据集算法采取不同的过滤技术来缩小搜索空间。实验与理论分析表明,对于稠密和稀疏数据两类数据集,算法都具有较好的时空效率。In this paper, an algorithm is presented for mining frequent patterns based on a static IS- tree. The algorithm builds frequent patterns directly, instead of high-cost candidate sets generation- and-test method used by Apriori. It gen approach, and works on a static IS-tree, In order to reduce search space , it characteristics of datasets. Our perform both dense datasets and sparse datasets. erates frequent rather than a c uses different ance study and patterns by depth first and pattern growth ostly dynamic tree adopted by FP-growth. filter technologies according to different theory analysis show that it is efficient in

关 键 词:数据挖掘 频繁模式 IS-树 FP-树 

分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象