一种分布环境中最大频繁项目集挖掘算法  被引量:1

Algorithm of Mining Maximum Frequent Pattern in Distributed Environment

在线阅读下载全文

作  者:李忠哗[1,2] 何丕廉[3] 

机构地区:[1]河北北方学院计算机系 [2]天津大学计算机学院,天津300072 [3]天津大学计算机学院

出  处:《微电子学与计算机》2006年第9期162-164,共3页Microelectronics & Computer

基  金:天津市科技发展计划项目(04310941R);天津市应用基础研究计划项目(05YFJMJC11700)

摘  要:挖掘最大频繁项目集是数据挖掘中的重要研究课题。目前已经提出的最大频繁项目集挖掘算法大多是基于单机环境的,在分布环境中挖掘最大频繁项目集的算法尚不多见。文章提出了一种基于分布数据库的并行挖掘最大频繁项目集的算法。该算法尽可能地让每个处理器独立地挖掘,采用频繁模式树(FP-tree)作为数据结构,可方便地从各局部FP-tree中挖掘局部最大频繁项目集及判断各项目集的支持度。采用传递侯选最大频繁项目集的方法。实验表明该算法是有效的并行算法。Mining maximum frequent itemsets is a key problem in data mining research. There are many algorithms of Mining maximum frequent itemsets based on local databases. Very little work has been done in distributed databases. Therefore, algorithm of mining maximum frequent itemsets in distributed databases is proposed. It attempts to make each processor to do independently. It adopts frequent pattern tree (FP-tree).It can mine locally maximum frequent itemsets easily from locally FP-tree and count support of each pattern easily. It transmits candidate pattern. Experimental results show that the algorithm is effective parallel algorithm.

关 键 词:分布数据库 数据挖掘 最大频繁项目集 频繁模式树 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象