基于一种文档表示模型的站内搜索引擎设计与实现  被引量:1

Website Search Engine Design and Implementation Based on a Document Representation Model

在线阅读下载全文

作  者:蒋辉[1] 阳小华[1] 刘志明[1] 闫仕宇[1] 马家宇[1] 李晓昀[1] 李萌[1] 周座[1] 

机构地区:[1]南华大学计算机科学与技术学院,湖南衡阳421001

出  处:《南华大学学报(自然科学版)》2013年第4期77-81,共5页Journal of University of South China:Science and Technology

基  金:湖南省自然科学基金资助项目(11JJ6047);衡阳市科技计划基金资助项目(2011KJ14;2013KG67);湖南省科技计划基金资助项目(2011FJ3087);南华大学计算机科学与技术校级重点学科基金资助项目

摘  要:根据全信息理论,认识论信息是语法信息、语义信息和语用信息的三位一体,在信息检索的过程中加入语用信息能有效的提高信息检索的质量.基于查询与内容的文档表示模型较好的利用了语用信息,对站内搜索引擎的查准率的提高有着很好作用;Lucene是一个用java语言开发的开源的全文搜索引擎架构.本文利用Lucene设计和实现一个基于查询与内容的文档表示模型的站内搜索引擎,实验结果表明该模型能有效的提高信息检索的查准率.According to the comprehensive information theory, epistemology information is the trinity of syntactic information, semantic information and pragmatic information. Making better use of pragmatic information in information retrieval can promote the quality of infor- mation retrieval. A document representation model based on query and content can make better use of pragmatic information, and it is good to promote the precision of the website search engine. Lucene is a open source full text search engine architecture which is devel- oped using java language. on document representatio We use lucene to design and implement a website engine based n model using query and that this model can effectively improve precision rate content. The experiment results show in information retrieval.

关 键 词:LUCENE 站内搜索引擎 搜索引擎 信息检索 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象