基于二级索引结构无候选项闭合序列模式挖掘算法  

Closed sequential pattern mining algorithm with no candidate sequence based on two-level index structure

在线阅读下载全文

作  者:缪裕青[1] 吴孔玲[1] 朱晓雁[1] 张锦杏[1] 

机构地区:[1]桂林电子科技大学计算机科学与工程学院,广西桂林541004

出  处:《计算机应用研究》2012年第10期3672-3676,共5页Application Research of Computers

基  金:广西可信软件重点实验室开放基金资助项目;广西研究生科研创新资助项目(2011105950812M22)

摘  要:针对CloSpan算法分两个阶段挖掘闭合序列模式中第一阶段需要保持候选序列且未充分利用项的位置信息、存在对数据库重复扫描和计算大小的不足,提出了posCloSpan算法。算法通过对二级索引结构进行检索实现向前剪枝,避免数据库重复扫描以及对超序索引表、子序索引表的检测,实现非闭合序列的修剪,无须保存候选序列。实验结果证明,算法在处理较长序列以及存在大量重复投影数据库的数据源时,有效降低了时间上的开销。Aiming at the defects of CloSpan algorithm when mining closed sequential pattern that it needs to maintain the candidate sequences in the first stage and do not make full use of the location information,exists repeatedly scanning database calculating database size,this paper put forward posCloSpan algorithm.By detecting the two-level index structure,the algorithm achieved forward pruning,avoided repeatedly scanning database.At the same time,it trimed non-closed sequences through detecting sup-sequence index table and sub-sequence index table,without saving candidate sequence.Experimental result shows that the algorithm can effectively reduce the time consumption in dealing with longer sequence and the data source that has a large number of duplicated project database.

关 键 词:数据挖掘 序列模式挖掘 闭合序列 CloSpan 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象