数据流中的频繁标记闭子树的批量挖掘  

A Batch Mining Algorithm for Frequent Closed Labeled Trees in Data Streams

在线阅读下载全文

作  者:冯博[1] 徐雅静[1] 赵娜[1] 徐惠民[1] 

机构地区:[1]北京邮电大学信息与通信工程学院,北京100876

出  处:《北京邮电大学学报》2010年第5期121-125,共5页Journal of Beijing University of Posts and Telecommunications

基  金:国家自然科学基金项目(60905017);国家高技术研究发展计划项目(2007AA01Z417)

摘  要:在频繁模式挖掘(FPM)的研究中,为了在海量数据流中有效地挖掘子树结构的频繁模式,根据数据流和子树模式的特点,提出了一种基于数据流的频繁标记闭子树挖掘(SFCLTreeMiner)算法.该算法首次对动态数据流中频繁标记闭子树的挖掘进行研究,给出了在数据流中标记闭子树集合添加、删除的批量挖掘方法,并结合时间衰减模型,有效保证了结果的时效性.实验结果表明,该算法在挖掘性能,如挖掘时间和内存占用等方面,比类似算法有较大提高.Compared with the classic frequent pattern mining (FPM) algorithms, the dynamic FPM algo- rithms on fast and massive data streams have become top research nowadays. A new batch mining algo-rithm in data streams called stream frequent closed labeled tree miner (SFCLTreeMiner) is proposed. SFCLTreeMiner uses a kind of adding-removing method between closed tree sets. Also it provides a time decay module for reasonable data updating. Experiment shows that SFCLTreeMiner is efficient in data streams mining by reducing consuming dramatically.

关 键 词:频繁子树挖掘 数据流 时间衰减 标记闭子树 批量挖掘 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象