检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]华中科技大学计算机科学与技术学院,湖北武汉430074
出 处:《计算机工程与科学》2005年第10期53-54,共2页Computer Engineering & Science
基 金:"十五"国家科技攻关计划资助项目(2001BA102A04-02-03)
摘 要:在大的数据集合中,开采其中的频繁项目集集合是数据挖掘中极具挑战的重要任务。已经有很多高效的算法被总结了出来。本文提出了一种思想,即开采频繁项目集集合的一个子集,我们称之为频繁无析取规则集集合,而并非开采完全的频繁项目集集合。我们证明能借助它不读取数据库而还原出频繁项目集集合的全集和它们的支持度。本文还提出了一个开采无析取规则集集合的算法HOPE-II,实验结果显示了其高效性。我们将它与另一种称为频繁封闭集的精简集进行对比,几乎所有的实验结果都显示使用无析取规则集集合比使用封闭集集合来开采频繁项目集集合更有效。Given a large set of data, extracting frequent itemsets in this set is a challenging job in data mining. Many efficient algorithms have been proposed in the literature. The idea presented in this paper is to extract a condensed representation of the frequent itemsets called disjunction-free sets, instead of extracting the whole frequent itemsets collection. We show that this condensed representation can be used to regenerate all frequent iternsets and their exact frequencies without any access to the original data. An algorithm, HOPE-Ⅱ, is presented to extract the frequent disjunction-free sets and practical experiments show that this representation can be extracted very efficiently. We compare it with another representation in the literature called frequent closed sets, and in nearly all the experiments we have done, the disjunction-free sets have been extracted much more efficiently than the frequent closed sets.
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.191.37.17