检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]浙江万里学院计算机系,浙江宁波315100 [2]杭州电子科技大学计算机学院,浙江杭州310018
出 处:《杭州电子科技大学学报(自然科学版)》2005年第5期60-63,共4页Journal of Hangzhou Dianzi University:Natural Sciences
摘 要:大量的候选项集是挖掘路径遍历模式中的主要问题。针对这个问题,提出了基于DHP算法的路径遍历算法,通过使用哈希技术在产生侯选项集时删除不满足条件的项目,这种方法特别是在产生候选2-项目时效率非常高,这样很好的解决了整个处理过程的性能瓶颈。另外,使用了整枝技术使事务数据库的大小在每次扫描后迅速减小。实验结果表明,基于DHP的频繁遍历路径算法在挖掘频繁项目集时是有效的。A huge set of candidates is the main problem in mining the path traversal patterns. In relation to this, the paper puts forward a path traversal algorithrn based on DHP, and uses a hashing technique to remove unsatisfied reference in the candidate itemsets generation. This method is effective especially in the number of candidate 2 - itemsets generation, hence resolving the performance bottleneck. In addition, pruning technique enables us to rapidly prone the transaction database size after every scan. Experimental results show that the algorithm is effective in mining frequent itemsets.
关 键 词:频繁遍历路径 数据挖掘 序列模式 关联规则 候选项目集 整枝技术
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222