检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]平顶山学院,河南平顶山467000
出 处:《平顶山学院学报》2008年第5期87-90,共4页Journal of Pingdingshan University
摘 要:Nutch是一个优秀的基于Java的开放源码搜索引擎,是以Lucene为基础实现的搜索引擎应用程序,其工作流程和现代商业搜索引擎工作原理一样:文本搜集、建立索引和查询.为了使它能够支持中文搜索,在分析了Nutch结构的基础上,采用词表分词技术和前向匹配分词算法对中文信息进行分词,以JavaCC脚本实现上下文相关文法中文分析模块,成功实现了Nutch中文搜索功能.Nutch is an excellent Java - based open source search engine, which is based on Lucene. And its progress is similar with current business search engine, searching texts, constructing indexes and queries. To enable Nutch to support Chinese search, on the basis of analyzing Nutch structures, this paper uses the word - separating technique based on the vocabulary and forward matching algorithm to separate words of Chinese information. Chinese analysis module is generated by JavaCC script, which results in supporting Chinese search with Nutch.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.224.33.235