基于不同信息资源专利查询扩展方法的研究  被引量:7

Research on Patent Query Expansion Methods Using Different Information Resources

在线阅读下载全文

作  者:许侃[1] 林原[1] 林鸿飞[1] 徐博[1] 

机构地区:[1]大连理工大学,大连116024

出  处:《情报学报》2016年第6期597-604,共8页Journal of the China Society for Scientific and Technical Information

基  金:国家自然科学基金资助项目(编号:61272370;61402075);国家863高科技计划资助项目(编号:2006AA01Z151);辽宁省自然科学基金(编号:201202031;2014020003);中央高校基本科研业务费专项资金资助

摘  要:近年来查询扩展方法已被证明能有效地提升专利检索的平均性能,而大多数查询扩展方法仅使用实验数据集进行扩展词选择,很少有研究将外部信息源利用于专利检索,提高检索准确率。因此,本文在实验数据集基础上,同时采用一种利用外部资源的方法提升专利检索性能。该方法利用谷歌搜索引擎优化查询扩展方法的性能,并采用排序学习方法LambdaMART方法融合不同查询扩展方法,对信息源中的不同文本域进行加权处理,从而提升专利检索性能。在TREC数据集上的实验结果表明,基于本文所采用的信息资源进行查询重构的方法有效地提升了专利检索的性能。Query expansion methods has been proven to be effective to improve the average performance of patent retrieval, and most query expansion methods use a single source of information experimental data set for query expansion term selection. In contrast, in this paper, we propose a method which exploits external resources for improving patent retrieval besides using experimental data set. We present a learning to rank framework that optimizes the combination of information sources used for effective query expansion terms. The Google search engine is used as external resources to enhance the performance of query expansion methods. We use the learning to rank method LambdaRank to combine approaches to improve patent retrieval by combining different query expansion methods with different text fields weighting strategies from information resources. Experiments on TREC data sets have shown that our method for query formulation is found to be effective to improve patent retrieval performance.

关 键 词:信息检索 查询扩展 排序学习 专利检索 

分 类 号:TP391.3[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象