检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]西安交通大学电子与信息工程学院,西安710049
出 处:《控制与决策》2007年第3期284-288,共5页Control and Decision
基 金:国家自然科学基金项目(60173058)
摘 要:提出一个基于Web日志的Web用户群体和站点URL聚类算法.使用用户浏览行为描述和用户浏览时间离散化方法建立了Web站点的用户事务矩阵,并在此基础上对Web用户群体和站点URL进行聚类.由于在聚类过程中同时考虑了用户对URL的浏览时间和访问次数,使算法的精度和效率都大大提高.同时,该算法能较好地处理类间重叠问题,使算法具有较好的实用性.最后对算法的有效性和可伸缩性进行了研究.By using new methods which are based on Web user's browsing behavior characterization and user's viewing time discretization, a new clustering algorithm for Web user communities and Web site's URLs is proposed. Web user access matrixes are set up on the preparation of Web logs. By considering user's viewing time and number of hits to Web site's URLs simultaneously, the accuracy and efficiency of the clustering algorithm are increased. The improved algorithm could solve the problem of the partial overlap bewteen clusters, which makes the algorithm more practical. The effectiveness and the sealability of the algorithm are studied through the experiments.
关 键 词:WEB使用挖掘 用户浏览模式 用户访问矩阵 用户事务聚类 站点URL聚类
分 类 号:TP391.11[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.138.119.75