基于索引数组的频繁项集挖掘算法  被引量:2

Frequent itemsets mining algorithm based on index array

在线阅读下载全文

作  者:张忠平[1] 李岩[1] 林志杰[1] 王爱杰[1] 

机构地区:[1]燕山大学信息科学与工程学院计算机应用技术,河北秦皇岛066004

出  处:《计算机应用研究》2009年第1期44-46,共3页Application Research of Computers

基  金:国家自然科学基金资助项目(60773100);国家教育部科学技术研究重点资助项目(205014);河北省教育厅科研计划资助项目(2006143)

摘  要:基于现有的关联规则挖掘算法,提出了一种通过循环迭代增加项为项集后缀的方式产生所有项集的新方法,构造了一种新的数据结构—索引数组,存储所发现的频繁1-项集及其相关信息,以便快速发现项集与事务之间的关系;并提出了一种基于索引数组的频繁项集挖掘新算法。该算法只需扫描数据库两次就能发现所有频繁项集。实验结果表明,该算法可以有效提高频繁项集的挖掘效率。The paper presented a new approach of increasing item to suffix of itemset reeursively according to the classical association rule mining algorithms. And used a new data structure--index array to store frequent 1-itemset and its correlative information. So the relations of itemsets and transactions were found quickly. Presented a frequent itemsets mining algorithm based on index array and could mine all frequent itemsets through scanning database only twice. The experimental results show that the proposed algorithm outperforms similar state-of-the-art algorithms.

关 键 词:数据挖掘 关联规则 频繁项集 索引数组 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象