检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]辽宁师范大学计算机与信息技术学院,大连116029 [2]辽河油田锦州工程技术处,凌海121209
出 处:《计算机科学》2008年第10期192-196,共5页Computer Science
基 金:国家自然科学基金项目(60603047);辽宁省教育厅高等学校科研基金(2008341);辽宁省自然科学基金;大连市优秀青年科技人才基金(2008J23JH026)
摘 要:提出了一种新的基于Web日志的挖掘用户浏览偏爱路径的方法。该方法首先在单元数组存储结构(存储矩阵)基础上建立以浏览兴趣度为基本元素的会话矩阵和路径矩阵。然后,在会话矩阵上采用两个页面向量夹角余弦作为相似用户的页面距离公式进行页面聚类,求得相似用户的相关页面集。最后,利用路径选择偏爱度在相似用户的路径矩阵上挖掘出相似用户的浏览偏爱路径。实验证明此方法是合理有效的,能够得到更准确的偏爱路径。This article proposed a new approach of mining user's preferred browsing paths based on Web logs. This approach first establishes session matrix and trace matrix by taking browsing interest as the fundamental element based on cell storage structure (storage matrix). Then carries on page clustering in the session matrix through using angle cosine in vector space between two pages,which is called the similar user's page distance formula. And we can get the similar user's relative pages set. Finally, mines the similar user's browsing preferred paths by using path choice-preference in similar user's trace matrix. Experiments prove that the approach is reasonable and effective and can discover more accurate preferred browsing paths.
关 键 词:浏览兴趣度 路径选择偏爱度 WEB日志 矩阵 页面聚类
分 类 号:TP393.4[自动化与计算机技术—计算机应用技术] TP311.13[自动化与计算机技术—计算机科学与技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.145