基于句法特征的冗长查询处理技术  

A Parsing Approach for Verbose Queries

在线阅读下载全文

作  者:姚兰[1] 林鸿飞[1] 林原[1] 马云龙[1] 

机构地区:[1]大连理工大学信息检索研究室,大连116024

出  处:《北京大学学报(自然科学版)》2013年第2期213-218,共6页Acta Scientiarum Naturalium Universitatis Pekinensis

基  金:国家自然科学基金(60673039;60973068);863计划(2006AA01Z151);教育部留学回国人员科研启动基金;高等学校博士学科点专项科研基金(20090041110002)资助

摘  要:将传统的"词袋"思想进行扩展,把文档看成由句子组成的"句袋",通过依存句法分析得到"句袋"与查询中词间的依存关系。利用两者依存关系的匹配程度,计算冗长查询和初次检索返回文档之间的相似度,对初始检索结果进行重排序。通过在TREC标准数据集上的实验,证明该方法能够较有效地解决查询的冗长导致偏离查询主题和低召回率情况下相关文档排序靠后的问题。特别是对于低召回率的情况,检索结果的MAP值和P@N都有显著提高。The authors extended the traditional "bag of words" idea. Every document was regarded as "bag of sentences". The dependency relationship of the words was obtained from the "bag of sentences" and verbose queries by dependency parsing. According to the matching degree of the dependence relationship, the similarity scores between verbose queries and documents was obtained. Finally, the initial results were re-ranked. Experiment on a standard TREC corpus shows that new approach can improve retrieval effectiveness for verbose query and the low recall rate. For the low recall rate, the MAP and P@N have a significantly improvement.

关 键 词:依存关系 冗长查询 结果重构 查询扩展 

分 类 号:TP391.3[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象