基于Aproiri算法的频繁项集挖掘优化方法  被引量:8

Frequent Itemsets Mining Optimization Methods Based on Aproiri Algorithm

在线阅读下载全文

作  者:吴学雁[1] 莫赞[1] 

机构地区:[1]广东工业大学管理学院,广州510520

出  处:《计算机系统应用》2014年第6期124-129,共6页Computer Systems & Applications

基  金:国家自然科学基金(71171062);教育部人文社科青年基金(13YJCZH200);广东工业大学高教研究基金(2012ZY26)

摘  要:为了进一步降低扫描数据库的次数和减轻内存负担,从而更好地提高挖掘频繁项集的效率,一种基于Apriori的优化算法(M-Apriori)被提出.该方法通过构建频繁状态矩阵来存放项集的频繁状态,构建事务布尔矩阵来存放事务与项集的关系,此算法只需在初始化阶段扫描一次数据库产生初始的频繁状态矩阵和事务布尔矩阵,并在此基础上直接递推产生所有的频繁项集.实验证明,与Apriori算法相比,M-Apriori算法具有更好的性能与效率.To reduce the number of database scanning and reduce the burden of memory further, also to improve the efficiency of mining frequent itemsets better, an Apriori-based optimization algorithm (M-Apriori) is proposed. The method stores frequent itemsets state by constructing the frequent state matrix and store the relationship between the transaction and itemsets by constructing the Boolean matrix. The algorithm scans the database only once and generates the initial frequent state matrix and the Boolean matrix during the initialization phase. On this basis, all frequent itemsets can be found directly without scanning the database repeatedly. Experiments show that M-Apriori algorithm has better performance and efficiency compared with the Apriori algorithm.

关 键 词:频繁项集挖掘 M-Apriori算法 关联规则挖掘 

分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象