检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]河北北方学院信息科学与工程学院,河北张家口075000
出 处:《情报科学》2011年第3期421-424,439,共5页Information Science
基 金:张家口市2009年科技攻关项目(0921047B)
摘 要:面对日益专业和个性化的信息检索需求,通用搜索引擎存在的问题暴露无遗。垂直搜索技术作为搜索引擎发展的一个主要方向,正在受到越来越多的关注。在给出一个垂直搜索引擎总体结构的基础上,详细分析了所涉及的关键技术:网页抓取、中文分词、文本分类等。并将分词和分类算法加入到Nutch中,实现了系统原型。实验证明,该系统主题相关度达到94%以上。Faced with increasingly professional and personalized needs of information retrieval, the problem for general search engine is exposed. It is more and more attention for vertical search technology as a major direction of search engine development. To gives the general structure of a vertical search engine, based on it, the key technologies involved are analyzed in detail: Web crawling, Chinese word segmentation, text classification and so on. And segmentation and classification algorithms add to the Nutch, realizing a prototype system. Experiments show that the degree of the system subject is to 94%.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222