在线挖掘数据流滑动窗口中频繁闭项集  被引量:2

Online mining closed frequent itemsets over a stream sliding window

在线阅读下载全文

作  者:敖富江[1] 杜静[2] 颜跃进[2] 黄柯棣[1] 

机构地区:[1]国防科学技术大学机电工程与自动化学院,湖南长沙410073 [2]国防科学技术大学计算机学院,湖南长沙410073

出  处:《系统工程与电子技术》2009年第5期1235-1240,共6页Systems Engineering and Electronics

基  金:国家自然科学基金资助课题(60704038)

摘  要:在线挖掘滑动窗口中的频繁闭项集是一类重要的数据流挖掘问题。提出了一种新的频繁闭项集挖掘算法FPCFI-DS。该算法能够在有限的存储空间中高速挖掘数据流滑动窗口中的频繁闭项集,并且能够在任意时刻维护当前窗口中精确的频繁闭项集。对于第一个窗口中的数据,FPCFI-DS算法采用单遍过程FPCFI进行挖掘,挖掘结果被保存于一棵全局闭项集树GCT中。当窗口向前滑动时,FPCFI-DS算法采用更新挖掘方式快速挖掘出当前窗口中的频繁闭项集。实验结果表明,FPCFI-DS算法的空间效率和时间效率都显著优于同类经典算法Moment。Online mining closed frequent itemsets in sliding window is one of the most important issues for mining data streams. A novel algorithm, FPCFI DS, is proposed, which can efficiently mine closed frequent itemsets over a stream sliding window with limited memory space, and maintain exact closed frequent itemsets in current window at any time. For data in the first window, the algorithm FPCFI-DS mines closed frequent itemsets using single-pass procedure, denoted as FPCFI. The resulting closed frequent itemsets are stored in a global closed frequent itemsets tree (GCT). When the window slides forward, the FPCFI DS quickly updates closed frequent itemsets in current window using the updating-mining method. The experimental results show that FPCFI-DS is superior to that of state-of-the-art algorithm Moment in terms of time and space efficiency.

关 键 词:数据流 滑动窗口 频繁闭项集 在线挖掘 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象