Web日志挖掘中3GWAP子网的获取研究  

Mining Web logs to discover 3G Web site

在线阅读下载全文

作  者:鲍钰[1] 

机构地区:[1]华东师范大学软件学院,上海200062

出  处:《计算机工程与应用》2009年第18期132-134,197,共4页Computer Engineering and Applications

基  金:国家重点基础研究发展规划(973)No.2005CB321904~~

摘  要:随着3G时代的到来,手机上网已逐步普及,由于手机屏幕较小及上网带宽限制,需要为手机访问者提供只需保留原Web站点主干分支的WAP子网。WWW上用户的访问路径信息会被记录在Web服务器的日志记录中,分析这些日志并挖掘出用户的主要行为模式,可以提取出Web网站被频繁访问的主干部分。首先将原始日志序列转化成用户访问路径会话集UVPSD,然后通过约束的加权网站结构图WWSSG,最终实现了此Web站点的频繁主干子网的发现。在上海社区网上采用此算法提取出的3GWAP子网,实验数据表明,该子网覆盖了上海社区网的大部分热门栏目页面。With the age of 3G,it is popular to visit WWW using mobile phone.Because of the small screen and slow net speed, it is better to provide a major sub Web site for the mobile phone visitors.The behavior of the Web page readers is imprinted in the Web server log files.Analyzing and exploring regularities in this behavior can find the high frequency visit path.Firstly,in this paper,converts the original sequence of log data into User Visit Path Session Dataset(UVPSD),then implements the discovery of major sub Web site structure by using reduced Weighted Web Site Structure Graph(WWSSG).This paper applies the algorithm on Shanghai community services Web site to get the 3G WAP major sub net.The experiment data indicates the sub net covers the major popular pages of the Web site.

关 键 词:WEB日志 用户访问路径会话集发现算法 加权网站结构图生成算法 3G无线应用协议 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象