检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]苏州大学计算机科学与技术学院,江苏苏州215006 [2]常熟理工学院计算机科学与工程学院,江苏常熟215500 [3]中国矿业大学计算机科学与技术学院,江苏徐州221008
出 处:《计算机应用与软件》2015年第3期34-36,92,共4页Computer Applications and Software
摘 要:根据Apriori算法的原理,提出一种具有跳跃式前进与回退补齐的改进算法J_Apriori。计算频繁K项集后,求出未剪枝的候选2K项集。在满足跳跃式前进策略的条件下先求出频繁2K项集,则2K项集的所有(K+1)至(2K-1)项子集不需要再扫描庞大的数据集,可以直接加入到频繁项集中,然后再回退补齐那些不是2K项集的子集的频繁项集。改进的算法减少了扫描数据集的次数。实验表明改进的算法有效地提高了Apriori算法的效率。According to the principle of Apriori algorithm,we propose a kind of improved Apriori algorithm with jumping forward and backing fill which is called J_Apriori. After computing frequent itemsets K,we get the candidate 2K itemsets without being pruned. When the candidate 2K itemsets are found first under the condition of meeting the jump forward strategy,then all the( K + 1) to( 2K- 1) sub-itemsets of 2K frequent itemsets need not to scan huge datasets and can be added to the frequent itemsets directly,and then back to fill the frequent itemsets which are not the subsets of 2K frequent itemsets. The improved algorithm reduces the number of scanning the datasets. Experiments show that the improved algorithm effectively raises the efficiency of Apriori algorithm.
关 键 词:数据挖掘 频繁项集 关联规则 APRIORI算法
分 类 号:TP3[自动化与计算机技术—计算机科学与技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.3