检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:王钊[1] 樊钊 Wang Zhao;Fan Zhao(School of Computer&Information,Hefei University of Technology,Hefei 230009,China)
机构地区:[1]合肥工业大学计算机与信息学院,合肥230009
出 处:《计算机应用研究》2018年第1期93-96,共4页Application Research of Computers
基 金:国家自然科学基金资助项目(61273297)
摘 要:通过对Web日志的聚类分析,可以发现用户的群体特征,甚至可以预测用户将来的访问模式,进而为不同的用户群提供个性化服务。针对现有方法的一般缺陷,包括特征选择单一无法充分体现用户兴趣偏好和传统Hierarchical算法在用户聚类时存在的收敛效率低、易受用户访问多样性影响的问题,提出了基于多重特征的双层用户聚类方法。该方法采用多重特征对用户相似性进行度量,并在此基础上进行双层聚类。采用基于密度的DBSCAN算法来排除用户会话中的离群对象和发现不规则簇,然后再采用自底向上的Hierarchical方法对第一层的聚类结果进行聚类。实验结果表明,该方法具有良好的稳定性和聚类效果。Web log clustering is a general task of exploratory data mining to find user group patterns on the Website and even predict user access behavior.It supplies personalized services for different user groups further.This paper introduced a two-layer Web user clustering method based on multiple feature selection to solve common problems that current algorithms had,including little user interests bias revealed by single feature selection,low convergence efficiency and the diversity of user access impact on traditional hierarchical clusters.This method took use of multiple characteristics for user similarity measurement,and conducted the two-layer clustering on the basis of this metric.First,the method eliminated outliers and detected irregular clusters by DBSCAN clustering.The second layer used the previous clusters to produce the final clusters by a botto-mup hierarchical algorithm.Experiments confirm that this method is stable and effective.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:13.59.203.127