检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:陈慧萍[1] 王建东[2] 叶飞跃[1] 王煜[2]
机构地区:[1]南京航空航天大学信息科学与技术学院,江苏南京210016 [2]河海大学计算机信息工程学院,江苏常州2130221
出 处:《系统工程与电子技术》2005年第9期1631-1635,共5页Systems Engineering and Electronics
基 金:国家973计划基础研究发展基金(G1999032701);江苏省自然科学基金(BK2002091)资助课题
摘 要:提出了一个基于频繁模式树即FP-tree和支持度数组相结合的最大频繁项集挖掘算法,首先建立FP-tree,同时建立支持度数组,然后在此基础上建立最大频繁项集树MAXFP-tree,MAXFP-tree中包含了所有最大频繁项集,缩小了搜索空间,提高了算法的效率。算法分析和实验表明,该算法对稠密型数据集和稀疏型数据集均适用,并且特别适于挖掘具有长频繁项集的数据集。An efficient algorithm based on FP-tree and support array for mining maximal frequent iternsets is proposed. At first the FP-tree and the support array are created at the same time. Then a maximal frequent itemsets tree- MAXFP-tree is built up to store all the maximal frequent itemsets. Therefore, it can reduce the search space and improve the efficiency of the algorithm. The results of experiment show the algorithm can be applied to both dense datasets and sparse datasets and it is especially effective for mining the datasets with long frequent itemsets.
关 键 词:数据挖掘 FP-TREE MAXFP-tree 支持度数组 最大频繁项集
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.40