分布式全局最大频繁项集更新挖掘算法  被引量:2

Algorithm of updating mining for distributed global maximal frequent itemsets

在线阅读下载全文

作  者:杨君锐[1] 杨莉[1] 

机构地区:[1]西安科技大学计算机科学与技术学院,陕西西安710054

出  处:《华中科技大学学报(自然科学版)》2011年第12期85-88,106,共5页Journal of Huazhong University of Science and Technology(Natural Science Edition)

基  金:陕西省自然科学基金资助项目(2009JM7007)

摘  要:提出了针对数据水平分布的分布式数据集下的全局最大频繁项集更新挖掘算法(UDMFI),用于解决当最小支持度阈值发生变化时全局最大频繁项集的更新挖掘问题.通过提出的带项目头表的频繁模式树(HFP-Tree)来存储数据,然后根据最小支持度阈值变小时,原最大频繁项集的集合中的元素一定是新最大频繁项集的集合中某些元素的子集的特性,以及最小支持度阈值变大时,原最大频繁项集中的一些最大频繁项集将可能不再是新最大频繁项集的集合中的最大频繁项集的特性,充分利用已挖掘的结果,从而减少挖掘过程中的费用.实验结果表明该算法具有较好的效率.A UDMFI(updating for distributed maximal frequent itemsets) algorithm was introduced under distributed database of data horizontal distribution.It considered the updating mining of global maximal frequent itemsets when minimum support measure threshold was adjusted dynamically.The proposed frequent pattern tree(HFP-Tree,head of frequent pattern tree) with header table stored the data.When the minimum support measure threshold was changed into a small or large one,some of original maximal frequent itemsets had to be subsets of the elements in new maximal frequent itemsets and could not be the elements in new maximal frequent itemsets.It made use of previous mining results to cut down the cost of mining process.The experimental results have shown that the proposed algorithm is efficient.

关 键 词:数据挖掘 分布式数据集 数据存储 最大频繁项集 更新挖掘 

分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象