检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]大连理工大学系统工程研究所,大连116024 [2]东北财经大学,大连116600
出 处:《情报学报》2009年第3期389-394,共6页Journal of the China Society for Scientific and Technical Information
基 金:基金项目:国家自然科学基金项目(70671016)资助.
摘 要:Web站点用户浏览模式自动分类可以更好地组织站点上的内容信息来满足不同用户的访问需求。Web使用挖掘技术已经在这项研究中得到了广泛的应用,但是集成Web内容挖掘的成果还不多见。本文首先给出了结合Web内容和使用挖掘技术的用户浏览模式分类的原型系统框架。系统中主要的过程是:对数据集中原始的Web服务器日志进行清理,使用Web使用挖掘技术从用户浏览会话中挖掘出有代表性的用户浏览模式,根据模式中每一个相关的页面内容抽取出一个N-gram集合,构建基于N-gram的用户浏览模式简档。最后本文对用户浏览会话作了分类实验分析,实验结果表明这个方法在N-gram=6,df=10%的情况下取得了较高的分类精确度。Automatic classification of user navigation patterns provides a useful tool to better organize the contents of the websites to cater to the needs of different users. Web usage mining techniques have been widely applied for such research. However, few efforts were made to integrate Web content mining with Web usage mining. Firstly, this paper presents the architecture of the prototype system proposed for classifying user navigation patterns. The main processes in the prototype system are: primary Web-log preprocessing to extract user navigation sessions from Dataset; mining the representatives of user navigation patterns; representing the contents of every Web page of user navigation patterns by N-grams; building N-gram-based user navigation pattern profiles. Finally, experiments are conducted on Web users' session classification and the results shows that the method achieves higher classification accuracy under condition of N-gram = 6 and df= 10% .
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.31