检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《计算机仿真》2004年第4期69-72,76,共5页Computer Simulation
基 金:国家 8 63项目资 (2 0 0 2AA1190 5 0 )
摘 要:定题搜索引擎将信息检索限定在特定主题领域 ,提供特定主题的信息检索服务 ,是新一代搜索引擎的发展方向之一。该文介绍了一个定题搜索robot系统NetBat2 .0 2版 ,它可以实现在web上爬行下载主题相关网页。定题搜索的关键技术是主题相关信息的搜索及网页相关度分析。该文分析了传统定题搜索算法的优缺点 ,提出了基于反向链接结合超链文本分析的定题搜索算法。文章还对基于内容的网页相关度分析算法进行了详细的论述。对比搜索实验表明系统有着较好的性能 。Focused search engine forces information search in the specific topic field and provides the search service in the related topic field. It is one of the development aims in new generation search engine. This paper describes NetBat 2.02, a focused search Robot system that can crawl on the Web and download topic related page. The key technology of focused search is the topic related information search and page relevance analysis. This paper resolves the advantage and disadvantage of Fish-Search Algorithm and Shark-Search Algorithm, then it presents the InverseLink-Based Search Algorithm. Meanwhile, the paper provides a detailed discussion of Content-based page relevance analysis algorithm. Experimental results indicate that the system has better performance and can crawl more topic relevance page.
关 键 词:定题搜索 搜索引擎 ROBOT 相关度分析 爬行算法 信息检索
分 类 号:TP393.09[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.38