检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:钟锋[1]
机构地区:[1]浙江外国语学院科学技术学院,浙江杭州310012
出 处:《浙江外国语学院学报》2013年第4期77-81,共5页Journal of Zhejiang International Studies University
基 金:浙江省教育厅科研计划项目(Y201018459)
摘 要:基于开源框架Lucene搭建了一个针对文本的全文检索系统,并对其进行扩展,支持多种类文本的全文检索.针对Lucene自带中文分词器的不足,提出了一种改进的基于字典的中文分词方法并将其应用到检索系统中去.该系统具有较高的文本检索准确率和召回率,具有一定的应用和推广价值.Full-text retrieval system can effectively improve the accurate and recall rate for text retrieval. This paper firstly put forward a full-text retrieval system based on the open source framework Lucene and ex- tends it to support the different types of texts.Secondly,a Chinese word segmentation algorithm based on the dictionary match is suggested to improve the accurate and recall rate of the Lucene.The result of the experi- ment shows that this full-text retrieval system has higher accurate and recall rate and brighter application fu- ture.
分 类 号:TP391.3[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.117