非页面日志信息在改进会话识别中的应用研究  

The application research of non-page log information in improving session identification

在线阅读下载全文

作  者:姜宏飞[1] 范纯龙[1] 徐蕾[1] 

机构地区:[1]沈阳航空工业学院计算机学院,辽宁沈阳110136

出  处:《沈阳航空工业学院学报》2010年第1期60-64,共5页Journal of Shenyang Institute of Aeronautical Engineering

摘  要:会话识别是web日志挖掘数据预处理的关键步骤,其质量对日志挖掘结果有重要影响。文章介绍了现有的会话识别方法,提出了利用数据清洗中废弃的图片等日志数据和web图结构,改进会话识别中的页面分组规则和路径补全算法,并通过实验证实方法对改善会话识别质量是有效的。Session identification is a key step for web log mining data pre - processing, and its quality has significant impacts on the log mining results. This paper introduces the current session identification methods, proposes a method which uses the web graph structure and log data including abandoned pictures in data cleaning to improve page grouping rules and path completion rules algorithm in the session identification. Finally the method is experimentally proved to be effective to improve the session identification of quality.

关 键 词:会话识别 数据预处理 web图结构 

分 类 号:TP393.08[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象