检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]沈阳航空工业学院计算机学院,辽宁沈阳110136
出 处:《沈阳航空工业学院学报》2010年第1期60-64,共5页Journal of Shenyang Institute of Aeronautical Engineering
摘 要:会话识别是web日志挖掘数据预处理的关键步骤,其质量对日志挖掘结果有重要影响。文章介绍了现有的会话识别方法,提出了利用数据清洗中废弃的图片等日志数据和web图结构,改进会话识别中的页面分组规则和路径补全算法,并通过实验证实方法对改善会话识别质量是有效的。Session identification is a key step for web log mining data pre - processing, and its quality has significant impacts on the log mining results. This paper introduces the current session identification methods, proposes a method which uses the web graph structure and log data including abandoned pictures in data cleaning to improve page grouping rules and path completion rules algorithm in the session identification. Finally the method is experimentally proved to be effective to improve the session identification of quality.
分 类 号:TP393.08[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.63