基于DHP的频繁遍历路径挖掘算法  被引量:5

An Algorithm for Mining Frequent Path Traversal Based on DHP

在线阅读下载全文

作  者:王涛伟[1] 周必水[2] 

机构地区:[1]浙江万里学院计算机系,浙江宁波315100 [2]杭州电子科技大学计算机学院,浙江杭州310018

出  处:《杭州电子科技大学学报(自然科学版)》2005年第5期60-63,共4页Journal of Hangzhou Dianzi University:Natural Sciences

摘  要:大量的候选项集是挖掘路径遍历模式中的主要问题。针对这个问题,提出了基于DHP算法的路径遍历算法,通过使用哈希技术在产生侯选项集时删除不满足条件的项目,这种方法特别是在产生候选2-项目时效率非常高,这样很好的解决了整个处理过程的性能瓶颈。另外,使用了整枝技术使事务数据库的大小在每次扫描后迅速减小。实验结果表明,基于DHP的频繁遍历路径算法在挖掘频繁项目集时是有效的。A huge set of candidates is the main problem in mining the path traversal patterns. In relation to this, the paper puts forward a path traversal algorithrn based on DHP, and uses a hashing technique to remove unsatisfied reference in the candidate itemsets generation. This method is effective especially in the number of candidate 2 - itemsets generation, hence resolving the performance bottleneck. In addition, pruning technique enables us to rapidly prone the transaction database size after every scan. Experimental results show that the algorithm is effective in mining frequent itemsets.

关 键 词:频繁遍历路径 数据挖掘 序列模式 关联规则 候选项目集 整枝技术 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象