蒙古文信息检索系统的设计与研究  

Design and Research on Mongolian Information Retrieval System

在线阅读下载全文

作  者:鲍玉来[1] 白淑霞[1] 李广华[2] 

机构地区:[1]内蒙古大学图书馆 [2]内蒙古大学计算机学院

出  处:《图书馆学研究》2017年第5期74-82,共9页Research on Library Science

基  金:国家自然科学基金项目“基于领域本体的蒙古文数字资源整合机制研究”(项目编号:71163029)资助成果

摘  要:文章结合蒙古文的独特性,研究蒙古文信息检索系统。首先搭建一个用于评价检索性能的蒙古文文档测试集,建立一套蒙古文信息检索系统。实验对比分析检索模型、平滑算法、蒙古文停用词表、词干还原和伪相关反馈等技术对蒙古文信息检索系统关键技术对检索性能的影响。实验结果表明,蒙古文信息检索系统选择结构化语言模型、Dirichlet平滑方法、停用词表、以词根做检索单元和伪相关反馈可以更好地提升检索性能。This paper focuses on Mongolian information retrieval (IR) . The authors build a standard Mongolian document dataset for evaluating the IR performance and set up a Mongolian information retrieval system. Based on them, the influences of related technologies such as IR models, smoothing algorithms, Mongolian stop words, Mongolian word stemming and pseudo-relevance feedback, are compared and analyzed. Experimental results show that the structured language model, Dirichlet smoothing, stop words, word stemming and pseudo-relevance feedback can improve the performance of the Mongolian information retrieval system.

关 键 词:信息检索 蒙古文信息检索 蒙古文Stemming 平滑算法 检索评价 

分 类 号:H212[语言文字—少数民族语言] G252.7[文化科学—图书馆学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象