基于Lucene的搜索引擎的研究与应用  被引量:12

Research and Application of Search Engine Based on Lucene

在线阅读下载全文

作  者:张俊[1] 李鲁群[1] 周熔[1] 

机构地区:[1]上海师范大学信息与机电工程学院,上海200234

出  处:《计算机技术与发展》2013年第6期230-232,共3页Computer Technology and Development

基  金:国家自然科学基金资助项目(60473092)

摘  要:互联网搜索的精确性一直是衡量搜索引擎性能的重要标志。针对普通搜索引擎的固有缺陷,文中提出了一种应用于新闻检索的搜索引擎。该引擎是利用开源的网络爬虫工具将互联网信息抓取到本地,并利用Lucene开放的API,对特定的信息进行索引和搜索。Lucene是基于Java开发的源代码开放的全文检索工具包,具有高性能、可扩展等特性,是实现搜索引擎的核心组件。通过对Lucene的API进行分析,并在此基础上,构建了索引和搜索的模块,并对网上新闻内容进行实时地搜索。通过与普通搜索引擎对比,该新闻搜索引擎提高了搜索的精确性。The precision of Internet searching is important signs of weighing the performance of search engine. In order to resolve the inherent vice about the general search engines, present a search engine applied in news search, which uses the web spider to fetch the information to local machine. The search engine also uses the open API of Lucene to index and search the special information. Lucene is a high -performance, extensible full text search kit based on Java,it is the core component for the realization of the search engine. Give an analy- sis of the API of Lucene. And on this basis,construct the index and search module,then search the news on the web with real time. By comparing with the general search engine, the news search engine improves accuracy in searching.

关 键 词:LUCENE 网络爬虫 索引 搜索 新闻搜索引擎 

分 类 号:TP39[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象