检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]广东工业大学计算机学院,广东广州510006
出 处:《江西师范大学学报(自然科学版)》2012年第4期395-398,共4页Journal of Jiangxi Normal University(Natural Science Edition)
基 金:广东省自然科学基金(06021484;9151009001000007);教育部重点实验室开放基金(110411)资助项目
摘 要:在常用的计算时间阈值识别方法的基础上,提出了一种改进的基于URL页面类型、页面信息量和访问时间的平均阈值识别方法.针对不同的页面类型采用不同的阈值计算方法设置时间阈值,相对于已有的对所有用户页面使用单一的先验阈值和现有动态阈值计算,该方法能够更真实地反映用户会话的情况,且识别的准确率有了较大提高.Based on the commonly used method of computing time threshold method, an improved method of ses- sion identification which based on page type, page size, visiting time is brought forward. For different page types, different threshold calculation methods are used to set the time threshold. Relative to the existing use of a single priori threshold and current dynamic threshold computing method, the method can give more realistic reflection of the session situation and the accuracy has been greatly improved.
关 键 词:WEB日志挖掘 数据预处理 用户会话识别 动态阈值
分 类 号:TP301[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.72