基于投影数据库的序列模式挖掘增量式更新算法  被引量:5

Incremental updating algorithm for sequence patterns mining based on projected database

在线阅读下载全文

作  者:陆介平[1] 刘月波[2] 倪巍伟[1] 陈耿[3] 孙志挥[1] 

机构地区:[1]东南大学计算机科学与工程学院,南京210096 [2]上海工程技术大学科研处,上海200366 [3]南京审计学院审计信息工程重点实验室,南京210029

出  处:《东南大学学报(自然科学版)》2006年第3期457-462,共6页Journal of Southeast University:Natural Science Edition

基  金:高等学校博士学科点专项科研基金资助项目(20040286009);江苏省自然科学基金资助项目(BK2004058);审计署审计科研所专项资助项目(SK2006007)

摘  要:针对序列模式挖掘中的增量挖掘问题,提出一种序列模式更新算法ISPBP.算法引入序列数据库结构来存储从原始数据库中挖掘出的所有项、最大频繁模式以及它们的支持数,采用间接拼接方法,只需处理增量数据库,避免了对更新后数据库的重新计算.对于因增量数据库新产生的频繁模式,利用了在增量数据库中出现的频繁项集来减小投影数据库,进一步提高了算法的效率.理论分析和实验表明,算法是有效可行的,并且增量数据库越大,算法在效率上的优越性越明显,算法ISPBP优于传统增量式更新算法.Considering the problem of incremental sequence pattern mining, an incremental sequential patterns mining based on projected database (ISPBP) algorithm is proposed. Sequential patterns base is applied to the algorithm, which stores all items, maximum frequent patterns and corresponding support counts in original database. Instead of remining impertinently, ISPBP updates the frequent items and patterns found previously by implicit merging and discovers new patterns by projection database. Furthermore ISPBP decreases the projection database using the frequent items in the increment database. Theoretical analysis and experiments testify that ISPBP is efficient and effective. The larger the scale of database, the more prominent the algorithm's efficiency. ISPBP outperforms the conventional incremental updating algorithms.

关 键 词:序列模式 数据挖掘 投影数据库 增量式更新 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象