基于DWLMS模型的分布式Web用户访问模式挖掘  被引量:2

Mining distributed web access patterns based on DWLMS model

在线阅读下载全文

作  者:张克君[1] 李伯群[1] 李欣[1] 杨炳儒[1] 

机构地区:[1]北京科技大学信息工程学院,北京100083

出  处:《清华大学学报(自然科学版)》2005年第S1期1762-1766,共5页Journal of Tsinghua University(Science and Technology)

基  金:国家教育部科技重点项目([2000]175);国家科技成果重点推广计划项目(2003EC00001)

摘  要:大型网站为了提高访问效率,通常建立多个镜像站点,这导致获取网站全局的用户访问模式知识变得困难。该文提出一种分布式W eb日志挖掘模型DW LM S,并以路径分析技术为例,提出了基于DW LM S的局部频繁路的更新算法LFP和全局频繁路径的更新算法GFP,解决了W eb访问信息的异地存储、实时增长、分布式算法通讯量等因素给模式分析过程带来的困难。对提出的算法进行了实现和实际日志数据的测试,结果证明了算法的有效性。A number of mirror image websites are established to improve the visited efficiency, which makes it difficult to obtain the overall user access patterns knowledge. The goal of web access patterns mining is to discover the access pattern and hidden information from the huge collection of documents plus hyperlink information, access and usage information. The path analysis technique is important. This paper presents a distributed web log mining system DWLMS model and the more general incremental updating algo...

关 键 词:Web用户访问模式挖掘 频繁路径分析 分布式数据挖掘 WEB日志挖掘 

分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象