基于向量的数据流滑动窗口中最大频繁项集挖掘  被引量:7

Algorithm based on vector for mining maximal frequent itemsets in sliding window over data streams

在线阅读下载全文

作  者:徐嘉莉[1] 陈佳[2] 胡庆[1] 黄波[1] 郭红霞[1] 

机构地区:[1]成都大学电子信息工程学院,成都610106 [2]电子科技大学计算机科学与工程学院,成都610054

出  处:《计算机应用研究》2012年第3期837-840,共4页Application Research of Computers

基  金:国家"863"计划资助项目(2007AA01Z443);成都大学校基金资助项目(2010XJZ16)

摘  要:针对相关算法在挖掘数据流最大频繁项集时所存在的问题,提出了一种基于向量的数据流滑动窗口中最大频繁项集挖掘算法。该算法首先用向量作为概要数据结构,采用定量更新滑动窗口策略解决时间粒度问题;其次通过位运算产生频繁项集,利用矩阵和数组存储辅助信息,深度优先搜索产生最大频繁项集时利用剪枝策略进一步减少挖掘时间;最后用索引链表存储挖掘结果以提高超集检测效率。理论分析和实验结果验证了该算法的有效性。This paper proposed an algorithm based on vector for mining maximal frequent itemsets in sliding window over data streams(MFISW) aimed at the mining problems of maximal frequent itemsets over data streams.Firstly,the algorithm used vector to express items in data streams and solved the problem of time granularity through quantitative updating strategies.Secondly,it stored the ancillary information using a matrice and a array in creating the frequent sets through the bit operation,and improved the mining efficiency again using pruning technology during creating the maximal frequent sets.Finally,it improved the detecting efficiency by using a index list to store mining results.Theoretical analysis and experimental results show the algorithm is efficient.

关 键 词:数据流 最大频繁项集 滑动窗口 向量 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象