基于网站日志挖掘的频繁遍历主干子网发现  被引量:1

Mining Web Logs to Discover Major Web Site Structure

在线阅读下载全文

作  者:鲍钰[1] 

机构地区:[1]华东师范大学软件学院,上海200062

出  处:《计算机系统应用》2009年第4期22-25,共4页Computer Systems & Applications

基  金:国家973计划项目(2005CB321904)

摘  要:WWW上用户的访问路径信息会被记录在WEB服务器的日志记录中,分析这些日志并挖掘出用户的主要行为模式,可以提取出WEB网站被频繁访问的主干部分。本文首先将原始日志信息整理成目标页前向访问路径集TUPD(Target Pages User Forward Access Path Dataset),然后在TUPD上生成加权网站结构多维树WWSSMT(Weighted Web Site Structure Multi-Tree),最后引入决策频度阀值S,删除所有WWSSMT中weight<S的子结点分支,最终实现了此WEB站点的频繁访问主干子网的发现。实验证明,挖掘获得的主干子网包含了某电子商务网站的最主要热销产品。

关 键 词:WEB日志 目标页前向访问路径集 加权网站结构多维树 主干子网 访问模式 

分 类 号:TP393.092[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象