针对中文检索的Lucene改进策略  被引量:10

STRATEGIES TO IMPROVE LUCENE AIMING AT THE CHINESE SEARCH

在线阅读下载全文

作  者:索红光[1] 孙鑫[1] 

机构地区:[1]中国石油大学计算机与通信工程学院,山东东营257061

出  处:《计算机应用与软件》2009年第6期175-177,共3页Computer Applications and Software

摘  要:为了提高基于Lucene中文检索系统的检索精度和效率,通过分析Lucene的结构,在系统中加入了中文分词模块和索引文档预处理模块。给出了具体的实验方法和实验过程,对改进原理和实验数据进行了分析,表明了加入中文分词模块和在索引预处理模块中采用提取特定数量的特征词来替代文档的方法能够有效提高Lucene检索系统的效率和精度,增强Lucene检索系统中文的性能。To improve the efficiency and accuracy of retrieval system based on Lucene in searching Chinese information, we add the Chinese word segmentation module and indexing documents pretreatment module into the system by analyzing the structure of Lucene. The specific way and process of experiment are given in the paper. Both the analysis of improvement principle in theoretic and the experimental results prove that, by substituting documents with specific quantity of characteristic words picked up in index pretreatment module, this method can effectively improve the efficiency and precision of Lucene retrieval system and enhance the proficiency of Lucene in searching Chinese words.

关 键 词:LUCENE 索引 中文分词 文档预处理 

分 类 号:TP316[自动化与计算机技术—计算机软件与理论] G354.4[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象