检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《洛阳理工学院学报(自然科学版)》2011年第1期56-60,共5页Journal of Luoyang Institute of Science and Technology:Natural Science Edition
摘 要:能够快速有效地检索网络上或站内大量的各种信息资源,是提供高质量检索服务的基础。CLucene是Lucene的C++本的实现,它是一个优秀的开源全文本搜索技术框架。分析了CLucene的系统结构,详解了CLucene中的索引和检索机制,在CLucene的基础上,解决了对WORD文档的文本抽取问题,增加了CLucene的中文支持功能,实现了一个基于CLucene并支持中英文WORD文档检索的应用实例。To fast and efficiently search the vast information resources of the network or station is the basis of providing high quality information retrieval service. CLucene is the realization of C++ version of Lucene, which is an excellent technology frame of full-text retrieval engine of open source code. This paper analyzes the structure of the CLucene system, explains the index and retrieval mechanisms of the CLucene in detail, resolves the problem of text extraction from WORD document on the basis of CLucene, adds the CLucene Chinese support function, and realizes the application based on the CLucene and supporting Chinese and English WORD document retrieval.
关 键 词:CLUCENE WORD 索引 文本抽取 全文检索
分 类 号:TP393.09[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:52.14.232.226