检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:周鹏[1,2] 吴华瑞[2] 赵春江[2] 杨宝祝[2] 朱华吉[2]
机构地区:[1]首都师范大学信息工程学院,北京100037 [2]国家农业信息化工程技术研究中心,北京100097
出 处:《计算机工程与设计》2009年第3期610-612,共3页Computer Engineering and Design
基 金:国家863高技术研究发展计划基金项目(2007AA10Z235;2007AA01Z179);国家科技支撑计划基金项目(2006BAJ09B04;2007BAD33B01)
摘 要:针对目前通用搜索引擎对专门领域及特定主题信息覆盖率较低,在开源的Nutch搜索引擎架构的基础上,通过Hash索引在多语种农业叙词表AGROVOC上进行农业词典的构建,利用已有的空间向量算法进行农业相关度计算,并结合Page-Rank的改进算法对结果综合排序,搭建了一个面向互联网上农业相关信息资源的搜索引擎。相对于通用搜索引擎来说减少了搜索结果的信息量,提高了搜索速度,同时提高了专业信息搜索的准确率。Owing to the lower coverage of the general search engine in special areas and specific theme, based on the open source structure Nutch search engine, constructing the agriculture dictionary through Hash algorithm and AGROVOC which is a multilingual, structured and controlled vocabulary, using the space vector algorithm to compute the agriculture-related degree and comprehensive sorting the page with the improved PageRank algorithm, which set up an agriculture-related information search engine oriented the internet. Compared to the general search engine, reducing the amount of information search results, improving the search speed and the accuracy of professional information search.
关 键 词:NUTCH 搜索引擎 农业词典 主题过滤 网页排序
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.141.24.158