自然语言检索扩展词库的构建方法  

Lexicon Construction Method for Query Expansion by Natural Language

在线阅读下载全文

作  者:吴建荣[1] 陈洪梅[1] 姚建民[1] 熊思勇[1] 

机构地区:[1]苏州市科学技术情报研究所,江苏苏州215021

出  处:《中国科技资源导刊》2013年第6期67-71,共5页China Science & Technology Resources Review

基  金:苏州市2011年基础设施计划项目“苏州市科技文献智能分析公共服务平台”(SZP201107)

摘  要:检索词自动扩展词库构建方法的基本思路是:根据语料是否规范化处理进行词库分类建设,优化了系统的检索性能;结合学科类别,对词库语料进行领域划分,引导科技人员对技术领域的准确把握;建设以本体库为基础,将与规范词具有关联性、相似性的语料通过关系表与关联库关联,把科技文献中的关键词组成一个有序的关系网,解决了传统检索系统中检索词无关联的不足;通过对检索词出现频率进行统计分析,进而更新词库,保证本体库、关联库语料的时效性,突破了人工对词库更新管理的受限性。For high retrieval precision and recall rate, a lexicon construction solution is introduced for query expansion in document retrieval. According to specific technology domain, an ontology based is built on basis of authoritative lexicons by the China national committee for terms and Wiktionary. Synonyms, hypernyms and hyponyms are acquired on basis of template matching and hierarchy structure reasoning from natural language contexts and Wikipedia. For better query expansion performance, a relationship network with statistical link strength is founded on basis of mutual information of related query terms. hTe above query term network enables a powerful knowledge management tool for document retrieval together with user logs and intermediate retrieval results.

关 键 词:自然语言 检索词 检索扩展 本体库 关联库 

分 类 号:G354[文化科学—情报学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象