Web日志挖掘中的数据预处理技术  被引量:22

Data Preprocessing Technique in Web Log Mining

在线阅读下载全文

作  者:李燕[1,2] 冯博琴[1] 鲁晓锋[2] 

机构地区:[1]西安交通大学电子与信息工程学院,西安710049 [2]西安理工大学计算机科学与工程学院,西安710048

出  处:《计算机工程》2009年第22期44-46,49,共4页Computer Engineering

基  金:国家"863"计划基金资助项目(2008AA01Z131)

摘  要:数据预处理是Web日志挖掘中的重要步骤,一般分为数据清理、用户识别、会话识别和路径补充。为消除代理服务器、防火墙和本地缓存对Web日志带来的影响,采用基于引用的分析方法完成用户会话识别和路径补充。实验结果表明,在Web访问日志中的记录引用信息较完整的情况下,该方法可以高效地获得用户的访问路径。Data preprocessing is the important step in Web log mining. It consists of four sub-steps, i.e. data cleaning, user identification, session identification and path completion. The referer-based method is adopted for user session identification and path completion, in order to avoid the problems introduced by using proxy servers, firewall, local caching, and so on. Experimental results reveal that the technique can obtain the user access path efficiently if accurate refercr information is available in Web access log.

关 键 词:WEB日志挖掘 数据预处理 用户会话识别 路径补充 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象