基于VOPP并行编程环境的最大频繁项集生成方法  

Algorithm for finding frequent itemsets based on VOPP

在线阅读下载全文

作  者:郑晓艳[1,2] 石连栓[2] 孙济洲[1] 

机构地区:[1]天津大学计算机科学与技术学院,天津300073 [2]天津工程师范学院计算机系,天津300222

出  处:《计算机应用研究》2009年第4期1305-1307,共3页Application Research of Computers

基  金:天津市自然科学基金资助项目(06YFJMJC01600)

摘  要:频繁项集挖掘是关联规则挖掘的核心内容,提出了一种挖掘最大频繁项集的并行算法CDTR。它对CD(counting distribution)算法进行了改进,根据一种新的分布式共享内存环境下面向视图并行编程思想,将数据库划分成视图。为了实现动态任务分配,对数据库进行了预处理。实验结果显示CDTR能够高效地生成最大频繁项集,大大提高了分布式共享内存系统的效率。Mining frequent item sets is a crucial issue in data mining applications. This paper proposed a novel and powerful parallel algorithm for mining maximal frequent item sets, called CDTR. CDTR improved the counting distribution algorithm based on VOPP ( view-oriented parallel programming), a novel style for parallel programming on cluster computers. It divided search space into views and preprocessed database to help dynamic tasks allocation. Experiments show that CDTR finds maxi- mal frequent item set efficiently and improves the performance of distribution shared memory system.

关 键 词:分布式共享内存系统 面向视图并行编程 关联规则 最大频繁项集 

分 类 号:TP338.6[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象