一种具有跳跃式前进的Apriori算法  被引量:10

A KIND OF APRIORI ALGORITHM WITH JUMPING FORWARD

在线阅读下载全文

作  者:陈方健[1,2] 张明新[1,2] 杨昆[3] 

机构地区:[1]苏州大学计算机科学与技术学院,江苏苏州215006 [2]常熟理工学院计算机科学与工程学院,江苏常熟215500 [3]中国矿业大学计算机科学与技术学院,江苏徐州221008

出  处:《计算机应用与软件》2015年第3期34-36,92,共4页Computer Applications and Software

摘  要:根据Apriori算法的原理,提出一种具有跳跃式前进与回退补齐的改进算法J_Apriori。计算频繁K项集后,求出未剪枝的候选2K项集。在满足跳跃式前进策略的条件下先求出频繁2K项集,则2K项集的所有(K+1)至(2K-1)项子集不需要再扫描庞大的数据集,可以直接加入到频繁项集中,然后再回退补齐那些不是2K项集的子集的频繁项集。改进的算法减少了扫描数据集的次数。实验表明改进的算法有效地提高了Apriori算法的效率。According to the principle of Apriori algorithm,we propose a kind of improved Apriori algorithm with jumping forward and backing fill which is called J_Apriori. After computing frequent itemsets K,we get the candidate 2K itemsets without being pruned. When the candidate 2K itemsets are found first under the condition of meeting the jump forward strategy,then all the( K + 1) to( 2K- 1) sub-itemsets of 2K frequent itemsets need not to scan huge datasets and can be added to the frequent itemsets directly,and then back to fill the frequent itemsets which are not the subsets of 2K frequent itemsets. The improved algorithm reduces the number of scanning the datasets. Experiments show that the improved algorithm effectively raises the efficiency of Apriori algorithm.

关 键 词:数据挖掘 频繁项集 关联规则 APRIORI算法 

分 类 号:TP3[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象