检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]大连理工大学系统工程研究所,大连116024 [2]东北财经大学,大连116023
出 处:《情报学报》2010年第2期208-214,共7页Journal of the China Society for Scientific and Technical Information
基 金:国家自然科学基金项目(70671016)资助.
摘 要:现有的Web用户访问路径信息发现方法大都着眼于从静态的Web日志快照中进行挖掘。本文力图从Web访问数据的历史演变过程中,发现新的知识——持久偏爱的Web用户访问路径PP-WAP。PP-WAP实际上是历史访问序列WAS中大部分时间支持度值波动很小且保持较高的访问路径信息。本文首先介绍了相关背景和PP-WAP的应用领域。接下来,利用无序树结构来表示历史WAS集合,同时给出了PP—WAP的定义和挖掘算法描述。最后,分别针对模拟和实际数据集对算法的可扩展性以及PP-WAP的应用价值作了实验分析。Existing Web access path mining techniques focus only on discovering knowledge from the static snapshot of Web log data. This paper tries to discover new knowledge--PP-WAP (persistent and preferred Web users' access paths) from dynamic nature of historical Web access data. These PP-WAPs are actually access paths whose support values keep higher and have fewer fluctuations in the historical Web access sequences (WAS). Firstly, the background and applications of PP-WAPs are introduced in this paper. Secondly, this paper adopts unordered tree structure to represent historical WAS sets and then presents the detailed definition and mining algorithm description of PP-WAP. Finally, according to simulation dataset and real dataset, this paper respectively conducts experiments to analyze the scalability of the algorithm and application value of PP-WAP.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.73