检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]南阳广播电视大学
出 处:《微型电脑应用》2014年第4期22-24,共3页Microcomputer Applications
摘 要:提出了一个基于Java的全文搜索引擎设计方案,该方案包括基于HTMLParser设计的网络蜘蛛、基于Lucene设计的索引器和检索器3部分。网络蜘蛛采用标签爬行策略和宽度优先遍历算法,实现了对网页的遍历;索引器对网络蜘蛛抓取到的网页创建索引,建立了索引数据库;检索器根据用户输入的关键词对索引数据库进行检索并将检索结果反馈给用户。检索实验证明,该搜索引擎是一个比较高效的检索工具。This paper proposes a full-text search engine design scheme based on Java.The scheme includes three parts:A web spider based on HTML Parser,an indexer and a searcher based on Lucene.The web spider uses tag crawling strategy and breadth-first traversal algorithm,realizes the traversal of web pages; the indexer create index for the page which is scraped by the web spider to build the index database; the searchers search on the index database according to the keyword entered by the user and return the search results back to the user.Retrieval experiments show that the search engine is a more efficient retrieval tools.
分 类 号:TP393[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.140.242.43