检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]江苏大学计算机科学与通信工程学院,江苏镇江212013
出 处:《计算机工程与设计》2010年第20期4497-4499,4523,共4页Computer Engineering and Design
基 金:江苏省高等科学基金项目(09KJB52003)
摘 要:为了揭示用户的访问模式,对传统的基于聚类技术构建用户概貌方法进行了研究,同时引入语义事务分析的观点,提出一种基于潜在语义模型构建用户概貌的方法。通过语义分析中的奇异值分解(SVD)算法,将构建的用户会话-浏览页面矩阵向量空间投影到潜在语义向量空间;利用扩展的K-means聚类算法,对潜在语义向量空间聚类生成用户会话聚类;计算浏览页面均值向量,构建以加权浏览页面集表示的用户概貌;最后采用加权平均访问百分比(WAVP)方法评价构建的用户概貌,表明了该方法的有效性。To reveal the user’s access pattern,a method of building user profile based on clustering technology is researched,meanwhile,the semantic analysis view and an approach based on latent semantic analysis is introduced to construct user profilesd.Firstly,user session-pageview matrix vector space is constructed and singular value decomposition(SVD) algorithm is applied to project into latent semantic vector space.An extended K-means clustering algorithm is performed on latent semantic vector space to generate user session clusters.Then,the pageview mean vector is computed to construct user profiles expressed in the form of a weighted pageview collection.Finally,the weighted average visit percentage(WAVP) is adopted to evaluate the constructed user profiles,and the validity and efficiency of the presented method is demonstrated.
关 键 词:潜在语义分析 用户概貌 聚类 用户事务信息 语义向量空间 奇异值分解
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.229