Web搜索引擎日志挖掘研究框架  被引量:4

A Research Framework of Web Search Engine Usage Mining

在线阅读下载全文

作  者:王继民[1] 李雷明子[1] 孟涛[2] 

机构地区:[1]北京大学信息管理系,北京100871 [2]北京大学信息科学技术学院,北京100871

出  处:《数字图书馆论坛》2011年第8期25-31,共7页Digital Library Forum

基  金:本研究得到国家社会科学基金(10BTQ050)、教育部人文社会科学基金(09YJA870002)和核高基项目(2011ZX01042-001-001)的资助.

摘  要:搜索引擎日志记录了用户与系统交互的整个过程。对日志文件进行挖掘,可以发现用户进行Web搜索的行为特征与规律,有效改善搜索引擎系统的性能。在对国内外相关研究进行系统梳理和总结的基础上,文章提出了一个Web搜索引擎日志挖掘的研究框架,主要包括日志挖掘的研究内容、数据集的选择方法、数据预处理的方法、不同地域用户行为的特征与比较、如何应用于系统性能的改善等内容。Log files of search engines record the interactive procedure between users and the system completely. Mining the logs can help us to discover the characteristics of user behaviors and to improve the performance of search systems. This paper gives a framework on Web search engine usage mining, which includes the choice of data collections, the methods of data preprocessing, and an analysis and comparison of search behaviors from different countries. We also explore its applications on improving the effectiveness and efficiency of search engines.

关 键 词:搜索引擎 用户日志 WEB使用挖掘 用户搜索行为 

分 类 号:TP393.4[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象