基于Lucene的语段模糊匹配中文检索系统设计与实现  

A Chinese Section Fuzzy Matching Information Retrieval System Based on Lucene

在线阅读下载全文

作  者:黄珏[1] 黄志远[1] 

机构地区:[1]浙江理工大学科技与艺术学院,杭州311121

出  处:《浙江理工大学学报(自然科学版)》2009年第1期109-113,共5页Journal of Zhejiang Sci-Tech University(Natural Sciences)

摘  要:为提高图书馆中文信息检索的精确度和有效性,设计了基于Lucene的语段模糊匹配中文检索系统。其采用了自然语言处理中的词语切分技术,使输入条件可以直接通过自然语言的方式提交,同时针对语段匹配的实际问题情境,设计了一种新的结果有效性判别模型,提高了检索结果相似度的科学性和准确性。经过多次实验结果的统计,搜索结果有效性可提高12%。For the purpose of improving the veracity and validity of Chinese information retrieval in library, the article designs the Chinese section fuzzy matching information retrieval system which is based on Lucene uses natural language split technology, and input can be directly submitted by natural language. Meanwhile, the paper designs a new model of validity estimation for the practical instance of section matching, improves the scientificity and veracity of similarity calculation of result aggregation. Several statistics indicate the validity of searching result is improved about twelve percents.

关 键 词:LUCENE 语段 中文检索 有效性判别 

分 类 号:TP393[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象