缩减投影数据库规模的增量式序列模式算法  被引量:2

Incremental Sequential Pattern Algorithm of Reducing Projected Database Size

在线阅读下载全文

作  者:刘佳新[1] 严书亭[2] 任家东[1] 

机构地区:[1]燕山大学信息科学与工程学院,河北秦皇岛066004 [2]燕山大学科学技术研究院,河北秦皇岛066004

出  处:《计算机工程》2012年第3期28-30,共3页Computer Engineering

基  金:河北省教育厅科学研究计划基金资助项目(2008498);河北省自然科学基金资助项目(F2010001298);秦皇岛市科学技术研究与发展计划基金资助项目(201001A018)

摘  要:在增量式序列模式挖掘算法中,数据库更新只有插入和扩展2种操作,未考虑序列删除的情况。为此,提出一种基于频繁序列树的增量式序列模式更新算法(IUFST)。在数据库和支持度发生变化时,IUFST算法分不同情况对频繁序列树进行更新操作,缩减投影数据库的规模,提高算法效率。实验结果表明,该算法在时间性能上优于PrefixSpan算法和IncSpan算法。This paper proposes an incremental sequential patterns updating algorithm based on frequent sequence tree, called IUFST, in order to solve the problem that when the database is updated, the existed incremental mining algorithms of sequential patterns only mention two kinds of database updates, insert and append rather than the delete operation. When the database is updated and the support is changed, IUFST is divided into four kinds of situations to update the frequent sequence tree. It reduces the size of the projected database and improves the efficiency. Experimental results show that IUFST outperforms PrefixSpan and IncSpan in time cost.

关 键 词:数据挖掘 增量式挖掘 序列模式 投影数据库 频繁序列树 深度优先 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象