基于CLucene的WORD文档全文检索系统研究与开发  被引量:2

Research and Development of WORD Document Full Text Search Engine Based on CLucene

在线阅读下载全文

作  者:杨文涛[1] 司应硕[1] 张森[1] 

机构地区:[1]郑州航空工业管理学院,河南郑州450046

出  处:《洛阳理工学院学报(自然科学版)》2011年第1期56-60,共5页Journal of Luoyang Institute of Science and Technology:Natural Science Edition

摘  要:能够快速有效地检索网络上或站内大量的各种信息资源,是提供高质量检索服务的基础。CLucene是Lucene的C++本的实现,它是一个优秀的开源全文本搜索技术框架。分析了CLucene的系统结构,详解了CLucene中的索引和检索机制,在CLucene的基础上,解决了对WORD文档的文本抽取问题,增加了CLucene的中文支持功能,实现了一个基于CLucene并支持中英文WORD文档检索的应用实例。To fast and efficiently search the vast information resources of the network or station is the basis of providing high quality information retrieval service. CLucene is the realization of C++ version of Lucene, which is an excellent technology frame of full-text retrieval engine of open source code. This paper analyzes the structure of the CLucene system, explains the index and retrieval mechanisms of the CLucene in detail, resolves the problem of text extraction from WORD document on the basis of CLucene, adds the CLucene Chinese support function, and realizes the application based on the CLucene and supporting Chinese and English WORD document retrieval.

关 键 词:CLUCENE WORD 索引 文本抽取 全文检索 

分 类 号:TP393.09[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象