检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:吴海燕[1] 朱靖君[1] 高国柱[1] 程志锐[1]
机构地区:[1]清华大学计算机与信息管理中心,北京100084
出 处:《小型微型计算机系统》2010年第9期1784-1789,共6页Journal of Chinese Computer Systems
基 金:国家"八六三"高技术研究发展计划项目(2007AA010306)资助
摘 要:随着Internet的迅速发展,Web站点的访问用户越来越多样化,不同种类用户的访问模式有所不同.提出一种基于会话分类的Web用户访问模式挖掘方法.这套方法把用户会话划分为人类用户会话、网络爬虫会话和资源下载类用户会话三大类,在此基础上分别对3类用户的访问模式进行挖掘.通过会话分类可以提高挖掘的效率与准确性.其中重点研究了人类用户的访问模式挖掘,提出一种基于用户访问路径树的事务识别方法,并对PrefixSpan算法进行了改进.这套方法在实验中取得了很好的挖掘效果.With the rapid development of Internet,web users are increasingly diversified.The access patterns of different kinds of users are different.This paper presents a method of mining web user access pattern based on session classification.This method divides all the user sessions into three categories,which are human user sessions,crawler sessions and resource-download user sessions.Then mine the access patterns of each kind of users respectively.Session classification can improve the efficiency and accuracy of mining.This paper focuses on mining the access pattern of human users.It presents a method of transaction identification based on users′ access-path-tree,and makes some improvements on PrefixSpan algorithm.This mining method achieves good results in the experiments.
关 键 词:WEB挖掘 会话分类 访问模式 序列模式 PREFIXSPAN
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.38