Web使用挖掘中的会话识别算法被引量：1

IMPROVED METHOD FOR SESSION IDENTIFICATION IN WEB LOG MINING

机构地区：[1]内蒙古农业大学计算机与信息工程学院,呼和浩特010018

出　　处：《内蒙古农业大学学报（自然科学版）》2010年第4期234-236,共3页Journal of Inner Mongolia Agricultural University(Natural Science Edition)

基　　金：内蒙古自治区自然科学基金(200408020110)

摘　　要：针对Web日志挖掘中的会话识别问题,在最常用的Timeout方法的基础上,提出了一种改进的基于平均时间阈值的识别方法。通过动态计算会话中请求记录间的平均时间间隔,个性化地调整页面的时间阈值,相对于传统的时所有用户页面使用单一的先验阈值,该方法能够更准确地识别出长对话。最后对生成的侯选会话集进行二次识别,使识别出的会话更为合理有效。实验结果表明,会话质量得到了提高。Toward session identification in web log mining,an access timeout-based improvement is carried out of session identification in web log mining.By calculating the average intervals dynamically among request records in the session,adjusting a threshold individually.Compared to the traditional method that defines a uniform threshold for all web pages experimentally,the approach presents can identify the long session more accurately.Then generating sets of candidate session is re-identified,which make the session more reasonable and effective.The quality of session identification is proved more efficiency by experiments.

关键词：WEB挖掘数据预处理会话识别时间阈值

分类号：TP301.6[自动化与计算机技术—计算机系统结构]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

Web使用挖掘中的会话识别算法被引量：1

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

高级检索检索式检索

时间限定

期刊范围

学科限定全选

高级检索 检索式检索

时间限定

期刊范围

学科限定全选

Web使用挖掘中的会话识别算法 被引量：1

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

相关期刊文献：

相关的主题

相关的作者对象

相关的机构对象

下载全文

用户登录

高级检索检索式检索

Web使用挖掘中的会话识别算法被引量：1