基于Lucene/Heritrix的垂直搜索引擎的研究与应用  被引量:21

STUDY AND APPLICATION OF VERTICAL SEARCH ENGINE BASED ON LUCENE AND HERITRIX

在线阅读下载全文

作  者:白坤[1] 耿国华[1] 

机构地区:[1]西北大学信息科学与技术学院,陕西西安710127

出  处:《计算机应用与软件》2009年第1期212-215,247,共5页Computer Applications and Software

摘  要:Lucene是一个用Java写的全文索引引擎工具包,访问索引时间快,支持多用户访问,可以跨平台使用。Heritrix是一个由Java开发的、开源的Web网络爬虫,用户可以使用它从网络上抓取想要的资源。探讨了Lucene和Heritrix在构建垂直搜索引擎中的应用。Lueene is a full text indexing engine package written in Java language. It has high access speed, supports multi-user accesses and can be sued in a cross-platform way. Heritrix is an open source web spider explored by Java. Users can snatch information from Internet by using it. In this paper it studies Lucene and Heritrix technology,analyzes the application in designing a Vertical Search Engine based on them.

关 键 词:LUCENE HERITRIX 垂直搜索引擎 

分 类 号:TP316[自动化与计算机技术—计算机软件与理论] TP393.4[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象