检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:倪廓阔[1] 吕学强[1] 韩艳铧[1] 王涛[1]
机构地区:[1]北京信息科技大学中文信息处理研究中心,北京100101
出 处:《计算机应用与软件》2012年第9期117-121,共5页Computer Applications and Software
基 金:国家社会科学基金项目(09CYY021)
摘 要:"N1+N2"作为现代汉语中常见的短语形式,亦广泛存在于搜索引擎检索用语中。以日志短语词典为基础,根据搜索日志查询串的语言特点,对包含"N1+N2"型短语的查询串进行改写,其中包括空格分割、引号加注和焦点强调方法,并对查询串粗略分类。实验结果显示:在引号加注的作用下MPA由0.362提高到0.441;导航类查询MRR值从0.64提升到0.719,信息事务类查询MRR值从0.25增加到0.344。从而验证了短语特征能够指导查询结果优化,进而提升搜索引擎性能。The "N1+N2" structure,as a common phrase structure in modern Chinese,is also widely used in retrieval parlance of search engine.In this paper,on the basis of phrase dictionary of query logs and according to language characteristics of search logs query strings,we rewrite the query strings containing "N1+N2" structure phrase in three ways,including the space segmentation,the quote marking and the focus-emphasising,and make preliminary classification on query strings.Experimental results show,the quote marking method makes MPA increase from 0.362 to 0.441,makes navigational query MRR improve from 0.64 to 0.719,and makes informational and transactional query MRR raise from 0.25 to 0.344.Therefore it verifies that the phrase characteristics can guide the query results optimisation and then enhance the performance of search engine.
关 键 词:“N1+N2”短语 搜索引擎 日志短语词典 查询优化
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.142.201.222