基于Lucene和Heritrix的全文搜索引擎的设计与实现  被引量:1

Design and Implementation of Full-Text Searching System Based on Lucene and Heritrix

在线阅读下载全文

作  者:张宣 刘晓飞 

机构地区:[1]民航数据通信有限责任公司,北京100191

出  处:《现代计算机》2013年第22期74-77,80,共5页Modern Computer

摘  要:分析全文搜索引擎的基本结构及原理,并使用开源工具Heritrix作为搜索引擎的爬虫负责下载Web页面、HTMLParser抽取Web页面的内容、Lucene提供索引和搜索服务,采用B/S模式实现一个全文搜索引擎。Analyzes the basic structure and principle of full-text search engine. And uses the open source tool Heritrix as a search engine crawler to download Web page, uses HTMLParser extract the content of Web page, Lucene provides indexing and search services, uses B/S model, achieves a full text search engine.

关 键 词:全文搜索引擎 LUCENE HERITRIX HTMLPARSER 网络爬虫 

分 类 号:TP391.3[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象