基于网站日志挖掘的频繁遍历主干子网发现被引量：1

Mining Web Logs to Discover Major Web Site Structure

作　　者：鲍钰[1]

机构地区：[1]华东师范大学软件学院,上海200062

出　　处：《计算机系统应用》2009年第4期22-25,共4页Computer Systems & Applications

基　　金：国家973计划项目(2005CB321904)

摘　　要：WWW上用户的访问路径信息会被记录在WEB服务器的日志记录中,分析这些日志并挖掘出用户的主要行为模式,可以提取出WEB网站被频繁访问的主干部分。本文首先将原始日志信息整理成目标页前向访问路径集TUPD(Target Pages User Forward Access Path Dataset),然后在TUPD上生成加权网站结构多维树WWSSMT(Weighted Web Site Structure Multi-Tree),最后引入决策频度阀值S,删除所有WWSSMT中weight<S的子结点分支,最终实现了此WEB站点的频繁访问主干子网的发现。实验证明,挖掘获得的主干子网包含了某电子商务网站的最主要热销产品。

关键词：WEB日志目标页前向访问路径集加权网站结构多维树主干子网访问模式

分类号：TP393.092[自动化与计算机技术—计算机应用技术]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于网站日志挖掘的频繁遍历主干子网发现被引量：1

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

基于网站日志挖掘的频繁遍历主干子网发现 被引量：1

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

基于网站日志挖掘的频繁遍历主干子网发现被引量：1