一种基于文档相似度的检索结果重排序方法  被引量:9

A Document Relevance Based Search Result Re-Ranking

在线阅读下载全文

作  者:周博[1] 岑荣伟[1] 刘奕群[1] 张敏[1] 金奕江[1] 马少平[1] 

机构地区:[1]智能技术与系统国家重点实验室清华大学计算机科学与技术系,北京100084

出  处:《中文信息学报》2010年第3期19-23,36,共6页Journal of Chinese Information Processing

基  金:国家自然科学基金资助项目(60736044;60903107);高等学校博士学科点专项科研基金资助项目(20090002120005);973国家重点基础研究资助项目(2004CB318108);863计划高科技资助项目(2006AA01Z141)

摘  要:对相关反馈问题的研究已有近30年的历史,相关反馈也被证明可以大程度稳定地提升检索系统的性能。当前网络环境下相关反馈的应用以及用户提供反馈信息的方式已经发生了明显的变化,因此相关反馈研究又一次引起了研究界的注意。该文提出了一种基于文档相似度的搜索结果重排序方法,该方法同时利用了反馈信息中的相关文档与不相关文档。在大规模网络信息检索标准实验数据上的实验结果表明:该方法不仅可以稳定地提高系统的检索性能,并且相较于经典的查询扩展方法有着明显的优势。Relevance Feedback has been studied in information retrieval research for the past 30 years. It has been shown to be worthwhile in a wide variety of settings, either the actual user feedback is availableor it is implicit. Since the applications of relevance feedback and the type of user input to relevance feedback have changed in the Web environment, the relevance feedback is again emphasized by researchers. A document relevance based search result re-ranking approach is proposed in this paper, which makes use of both the relevant documents and irrelevant documents in feedback information. The approach is shown to be consistently valid for performance improvement on the standard large scale test dataset of TREC 2008 Relevance Feedback Track.

关 键 词:计算机应用 中文信息处理 相关反馈 文档重排序 信息检索 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象