全文检索系统的数据预处理研究  被引量:3

Study of Data-Pretreatment for Full-Text Search System

在线阅读下载全文

作  者:韩升[1] 刘广志[1] 

机构地区:[1]北京交通大学软件学院,北京100044

出  处:《计算机技术与发展》2006年第3期208-210,共3页Computer Technology and Development

摘  要:全文检索的应用导致了信息检索领域的一场革命,是文档数据库研发的核心。在一个全文检索系统中,全文索引数据库的建立是系统的基础,其设计结构直接影响到全文检索引擎的检索算法以及系统最终的检索效率。文中主要介绍全文检索系统中索引库结构设计、文本标引技术等数据预处理技术,以及全文检索系统索引数据库的数据处理流程。最后,在此基础上研究了全文检索系统索引库索引生成算法,给出了单个文档和批处理两种情况下的索引库索引生成算法。The application of full- text search has caused a revolution of the information retrieval field. It is the core that the file database researches and develops. In a full- text search system, the setting - up of the index database of full text is a systematic foundation. Its project organization influences the final search efficiency of searching algorithm and system of the full - text search engine directly. This paper introduces such data- pretreatment technology as index database structural design, text index technology, etc. Also introduces that in the full-text retrieval system mainly, and the data processing procedure of index database of full- text retrieval system. Finally, studied the produce- algorithms of index database of full- text retrieval system on this basis, provided produce - algorithm of index database under two kinds of situations: individual file and hatch processing.

关 键 词:全文检索 预处理 文本标引 索引数据库 

分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象