应用于信息检索的统计语言模型研究进展  被引量:4

Progress in Research on Statistical Language Modeling for Information Retrieval

在线阅读下载全文

作  者:李纲[1] 郑重[1] 

机构地区:[1]武汉大学信息资源研究中心,湖北武汉430072

出  处:《情报理论与实践》2008年第3期471-476,共6页Information Studies:Theory & Application

基  金:国家自然科学基金项目"文本集特征提取方法及应用研究"的研究成果之一;项目编号:70673070

摘  要:统计语言模型作为一种自然语言处理的工具,已经被证明有能力处理大规模真实文本。而统计语言模型和IR相结合后所形成的SLM-IR模型的提出,是信息检索模型研究上的重大进展。本文介绍了统计语言模型在信息检索领域的基本模型及相关问题,重点分析了Lemur工具箱和标题语言模型的原理及模型,最后从整体上介绍了该领域的国际动态和研究进展情况。As a natural language processing tool, statistical language modeling is proved to be able to process large-scale real text. The advance of SLM-IR model, which is the combination of Statistical Language Modeling (SLM) and Information Retrieval (IR) , represents a great progress in the research on IR modeling. This paper introduces the basic model of SLM in IR field and some related problems with emphasis on analyzing the principles and modeling of Lemur and Title Language Model. Finally, the paper introduces the development trend and research progress of this field in the world.

关 键 词:信息检索 统计语言模型 查询条件概率模型 主题语言模型 

分 类 号:G354[文化科学—情报学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象