持久偏爱的Web用户访问路径信息挖掘方法  被引量:5

Algorithm Research on Mining Persistent and Preferred Web Users' Access Paths

在线阅读下载全文

作  者:朱志国[1,2] 邓贵仕[1] 

机构地区:[1]大连理工大学系统工程研究所,大连116024 [2]东北财经大学,大连116023

出  处:《情报学报》2010年第2期208-214,共7页Journal of the China Society for Scientific and Technical Information

基  金:国家自然科学基金项目(70671016)资助.

摘  要:现有的Web用户访问路径信息发现方法大都着眼于从静态的Web日志快照中进行挖掘。本文力图从Web访问数据的历史演变过程中,发现新的知识——持久偏爱的Web用户访问路径PP-WAP。PP-WAP实际上是历史访问序列WAS中大部分时间支持度值波动很小且保持较高的访问路径信息。本文首先介绍了相关背景和PP-WAP的应用领域。接下来,利用无序树结构来表示历史WAS集合,同时给出了PP—WAP的定义和挖掘算法描述。最后,分别针对模拟和实际数据集对算法的可扩展性以及PP-WAP的应用价值作了实验分析。Existing Web access path mining techniques focus only on discovering knowledge from the static snapshot of Web log data. This paper tries to discover new knowledge--PP-WAP (persistent and preferred Web users' access paths) from dynamic nature of historical Web access data. These PP-WAPs are actually access paths whose support values keep higher and have fewer fluctuations in the historical Web access sequences (WAS). Firstly, the background and applications of PP-WAPs are introduced in this paper. Secondly, this paper adopts unordered tree structure to represent historical WAS sets and then presents the detailed definition and mining algorithm description of PP-WAP. Finally, according to simulation dataset and real dataset, this paper respectively conducts experiments to analyze the scalability of the algorithm and application value of PP-WAP.

关 键 词:数据挖掘 Web访问路径 动态数据挖掘 

分 类 号:G250.76[文化科学—图书馆学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象