基于搜索日志的用户行为分析  被引量:6

User Behavior Analysis Based on Search Engine Log

在线阅读下载全文

作  者:童国平[1] 孙建军[1] 

机构地区:[1]南京大学信息管理学院,南京210093

出  处:《现代图书情报技术》2015年第7期80-88,共9页New Technology of Library and Information Service

基  金:国家社会科学基金重大招标项目"面向学科领域的网络信息资源深度聚合与服务研究"(项目编号:12&ZD221);国家自然科学基金项目"融合范式视角下的链接分析理论集成框架及其实证研究"(项目编号:71273125)的研究成果之一

摘  要:【目的】利用搜索引擎日志数据对用户查询行为特征进行分析。【方法】采用分词、统计分析、聚类分析、可视化等方法,分别从用户的查询串、查询方式、查询主题、查询点击行为和用户类型5个方面对用户使用搜索引擎时的行为特征进行分析。【结果】发现搜索用户偏好使用2-5个中文名词短语组成的查询串;更少使用口语化查询,不爱使用高级检索功能;查询用词变得多样化;查询时间存在高峰低谷;再次证实存在"翘尾现象"。【局限】使用的数据量不够大,没有结合用户详细信息进行分析。【结论】使用搜索引擎日志可以获得用户行为特征,并能为改善搜索引擎提供一些建议。[Objective] This paper aims to analyse user behavior based on search engine log. [Methods] Analyse user behavior from query string, query methods, query subjects, user click behavior and user types by word segmentation, statistical analysis, clustering analysis and visualization. [Results] Search users prefer to use 2-5 Chinese noun phrases; Use less colloquial query strings; Dislike using advanced search functions; Perfer to use various query strings; There are peaks and valleys in the number of users. Up-tail phenomenon is confirmed once again in this research. [Limitations] The amount of data used in this paper is not big enough and details of user information is not considered. [Conclusions] Analy- sis on search engine log is beneficial to acquisition of user behavior characteristics and improving search performance.

关 键 词:搜索引擎日志 查询日志 用户行为分析 日志挖掘 

分 类 号:TP391.3[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象