检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:张克君[1] 李伯群[1] 李欣[1] 杨炳儒[1]
出 处:《清华大学学报(自然科学版)》2005年第S1期1762-1766,共5页Journal of Tsinghua University(Science and Technology)
基 金:国家教育部科技重点项目([2000]175);国家科技成果重点推广计划项目(2003EC00001)
摘 要:大型网站为了提高访问效率,通常建立多个镜像站点,这导致获取网站全局的用户访问模式知识变得困难。该文提出一种分布式W eb日志挖掘模型DW LM S,并以路径分析技术为例,提出了基于DW LM S的局部频繁路的更新算法LFP和全局频繁路径的更新算法GFP,解决了W eb访问信息的异地存储、实时增长、分布式算法通讯量等因素给模式分析过程带来的困难。对提出的算法进行了实现和实际日志数据的测试,结果证明了算法的有效性。A number of mirror image websites are established to improve the visited efficiency, which makes it difficult to obtain the overall user access patterns knowledge. The goal of web access patterns mining is to discover the access pattern and hidden information from the huge collection of documents plus hyperlink information, access and usage information. The path analysis technique is important. This paper presents a distributed web log mining system DWLMS model and the more general incremental updating algo...
关 键 词:Web用户访问模式挖掘 频繁路径分析 分布式数据挖掘 WEB日志挖掘
分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.80