基于Apriori的Web访问模式挖掘算法  被引量:3

Apriori-based Web Traversal Pattern Mining Algorithm

在线阅读下载全文

作  者:刘美玲[1,2] 苏毅娟[2,3] 

机构地区:[1]广西民族大学信息科学与工程学院,广西南宁530006 [2]广西师范学院科学计算与智能信息处理广西高校重点实验室,广西南宁530023 [3]广西师范学院计算机与信息工程学院,广西南宁530023

出  处:《计算机与现代化》2013年第10期1-5,共5页Computer and Modernization

基  金:科学计算与智能信息处理广西高校重点实验室基金项目(GXSCIIP201201);广西教育厅科研项目(201106LX131)

摘  要:简要介绍Apriori算法与Web访问路径的有向图表示方法,提出一种从Web日志文件中得到频繁访问模式的算法,该算法以Apriori算法为基础,并以访问路径序列的有序性特点作为候选集的剪枝策略,减少候选集的生成,提高算法的效率。在真实数据集和模拟数据集上分别进行实验,实验结果表明该算法是有效的,且适应性好。The Apriori algorithm and the directed graph representation method for Web traversal paths are briefly introduced, and an algorithm based on Apriori is proposed for generating frequent traversal patterns from Web log files. The proposed algorithm u- ses the orderliness of the traversal paths as pruning strategy of candidate set, thus it can decrease the scale of candidate sets and improve efficiency. Some experiments are conducted with real datasets and simulated datasets, and the experimental results show the effectiveness and good adaptability of the proposed algorithm.

关 键 词:WFTP算法 Web日志文件 数据挖掘 频繁访问路径 有序访问路径 

分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象