多维数据流最大频集挖掘模型和算法  

A Model and an Algorithm to Mine Maximal Frequent Itemsets From Multidimensional Data Stream

在线阅读下载全文

作  者:毛国君[1] 孙晓希[1] 宗东军[1] 

机构地区:[1]北京工业大学计算机学院,北京100124

出  处:《北京工业大学学报》2010年第6期820-827,共8页Journal of Beijing University of Technology

基  金:国家自然科学基金资助项目(60496322)

摘  要:为了挖掘到有价值的信息,需要挖掘多维数据流上的频繁项目集,因此引入多维项目和多维项目集的概念表示多维数据流上的项目.设计了一种紧凑、压缩的数据结构MaxFP-Tree用于维护多维项目集,并在MaxFP-Tree的基础上设计了挖掘多维数据流上最大频集的增量式更新算法.实验结果表明,设计的挖掘多维数据流中最大频集的模型和算法是高效的.In order to get valuable information,mining frequent itemsets from multidimensional data stream is needed.Through introduction of the concept of multidimensional item and multidimensional itemsets,the multidimensional data stream is expressed.A compact,compressed data structure MaxFP-Tree is designed to maintain multidimensional sets.Based on MaxFP-Tree,an incremental update algorithm to mine maximal frequent multidimensional itemsets is given.Experiment results show that the model and the algorithm of mining multidimensional data streams are efficient.

关 键 词:数据流 数据挖掘 最大项目集 最大频繁多维项目 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象