检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]武汉科技大学城市学院信息工程学部,湖北武汉430083
出 处:《计算机技术与发展》2012年第1期140-142,160,共4页Computer Technology and Development
基 金:湖北省教育科学"十一五"规划2009年度立项课题(2009B236)
摘 要:互联网的快速发展也使搜索引擎不断的发展着,而搜索引擎逐渐转向商业化运行,使得搜索引擎的技术细节越来越隐蔽。文章研究和分析了搜索引擎工具Lucene的原理、模型和索引器,设计了一个搜索引擎系统。该系统采用了非递归的方式负责Web站点的网页爬取以及爬取过程中URL链接的存储、处理等,并通过多线程技术管理多个抓取线程,实现了并发抓取网页,提高了系统的运行效率。最后采用JSP技术设计了一个简易的新闻搜索引擎客户端,系统可以稳定运行,基本符合搜索引擎原理的探索,具有一定的现实意义。Search engine has made a constant development with the development of the interact,but its gradual shifting to commercial operation makes the technical details of search engine more and more hidden. Based on research and analysis of the system strocture,model and indexer of Lucene,it implements a search engine system, this system uses a non-recursive mode to take responsibility for Web craw- ling in the Web and distributing,handling of URL links in the process of crawling,it manages multiple crawling threads by multi-threa- ding technology,implements concurrently Web pages crawling and improves the system operating efficiency. And then, use JSP technolo- gy to design a simple news search engine clients. The system can run stable in line which achieves the search engine' s principles and has certain significance.
分 类 号:TP31[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.170