检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]河北北方学院计算机系 [2]天津大学计算机学院,天津300072 [3]天津大学计算机学院
出 处:《微电子学与计算机》2006年第9期162-164,共3页Microelectronics & Computer
基 金:天津市科技发展计划项目(04310941R);天津市应用基础研究计划项目(05YFJMJC11700)
摘 要:挖掘最大频繁项目集是数据挖掘中的重要研究课题。目前已经提出的最大频繁项目集挖掘算法大多是基于单机环境的,在分布环境中挖掘最大频繁项目集的算法尚不多见。文章提出了一种基于分布数据库的并行挖掘最大频繁项目集的算法。该算法尽可能地让每个处理器独立地挖掘,采用频繁模式树(FP-tree)作为数据结构,可方便地从各局部FP-tree中挖掘局部最大频繁项目集及判断各项目集的支持度。采用传递侯选最大频繁项目集的方法。实验表明该算法是有效的并行算法。Mining maximum frequent itemsets is a key problem in data mining research. There are many algorithms of Mining maximum frequent itemsets based on local databases. Very little work has been done in distributed databases. Therefore, algorithm of mining maximum frequent itemsets in distributed databases is proposed. It attempts to make each processor to do independently. It adopts frequent pattern tree (FP-tree).It can mine locally maximum frequent itemsets easily from locally FP-tree and count support of each pattern easily. It transmits candidate pattern. Experimental results show that the algorithm is effective parallel algorithm.
关 键 词:分布数据库 数据挖掘 最大频繁项目集 频繁模式树
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.31