检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]长春理工大学计算机科学技术学院,长春130022
出 处:《长春理工大学学报(自然科学版)》2011年第4期149-152,共4页Journal of Changchun University of Science and Technology(Natural Science Edition)
摘 要:全文检索作为现代信息检索技术的一个重要分支,不仅是处理非结构化数据的重要工具,也是搜索引擎的主流技术之一。本文首先从全文搜索引擎模型入手,对其基本工作原理和流程进行深入研究,并结合这些知识研究开源检索引擎包Lucene的架构原理及其开发应用方法。然后介绍中文分词和基本算法及Lucene的相关技术。As an important branch of modern information retrieval technology,full-text search is not only an important tool for dealing with unstructured data,but also one of the mainstream technology of search engines.This paper starts from studying the working principles and process of search engine model in depth,and talks about Lucene's architecture with privious knowledge and how to use Lucene.Finally,mainly for some basic algorithms of chinese segmentation and relevance ranking,we set up a Lucene-based full-text document retrieval system by applying these technologies.
分 类 号:TP393.02[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.145