基于支持向量机的Web日志用户标志修正算法  被引量:1

User identifier correction algorithm in Web logs based on support vector machine

在线阅读下载全文

作  者:邹根[1,2,3,4] 闻立杰[2,3,4] 

机构地区:[1]清华大学计算机科学与技术系,北京100084 [2]清华大学软件学院,北京100084 [3]清华大学信息系统安全教育部重点实验室,北京100084 [4]清华大学信息科学与技术国家实验室(筹),北京100084

出  处:《计算机集成制造系统》2011年第8期1851-1855,共5页Computer Integrated Manufacturing Systems

基  金:国家自然科学基金资助项目(61003099);国家973计划资助项目(2009CB320700);国家863计划资助项目(2008AA042301);核高基专项资助项目(2010ZX01042-002-002-01)~~

摘  要:针对用户删除Cookie导致的Web日志用户标志不准确的情况,提出了一种基于支持向量机的用户标志修正算法。首先训练一个分类器判断两个会话是否属于同一个用户,然后计算两个不同标志用户之间的相似度,最后将日志进行分组,发现所有删除Cookie的用户并进行标志的修正。通过实验验证了算法的有效性。Aiming at the problem of Cookie deletion led to user identifier inaccuracy,a correction algorithm based on Support Vector Machine(SVM) was proposed to identify users.A classifier was trained firstly to judge whether two sessions belonged to a same user,and then the similarity between different user identifiers was calculated.Finally,Web logs were divided into groups to find all users whose Cookie had been deleted,and made identifier correction.Experiment results verified that the proposed method was effective.

关 键 词:WEB日志 数据预处理 用户识别 支持向量机 数据挖掘 

分 类 号:TP393.09[自动化与计算机技术—计算机应用技术] TP311.13[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象