检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]东南大学计算机科学与工程系,南京210096
出 处:《计算机研究与发展》2003年第4期620-626,共7页Journal of Computer Research and Development
基 金:国家自然科学基金 (79970 0 92 )
摘 要:分布式环境中 ,全局频繁项目集的挖掘是数据挖掘中最重要的研究课题之一 传统的全局频繁项目集挖掘算法采用Apriori算法框架 ,须多遍扫描数据库并产生大量的候选项目集 ,且通过传送局部频繁项目集求全局频繁项目集的网络通信代价高 为此 ,提出了一种分布数据库的全局频繁项目集快速挖掘算法———FMAGF FMAGF算法采用传送条件频繁模式树或条件模式基来挖掘全局频繁项目集 ,可有效地减小网络通信量 ,提高全局频繁项目集挖掘效率Fast mining of global frequent itemsets is an important data mining problem in a distributed database environment Conventional mining algorithms employ the same framework as Apriori for global frequent itemsets However, candidate set generation is still costly, and the algorithms need repeatedly scan the database, especially when there exist prolific patterns and/or long patterns And communication overhead is costly by transmitting local frequent itemsets for global frequent itemsets In this paper, an algorithm FMAGF(fast mining algorithm of global frequent itmesets) in distributed database is proposed The idea of FMAGF is to only transmit conditional frequent pattern trees or conditional pattern bases but not to transmit a lot of local frequent itemsets; therefore, the algorithm uses far less communication overhead and improves efficiency of mining global frequent itemsets Theory analysis and experimental results show the feasibility and effectiveness of the algorithm
关 键 词:数据挖掘 全局频繁项目集 频繁模式树 快速挖掘算法 布尔型关联规则 数据库 APRIORI算法
分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.28