多格式文档搜索引擎索引系统设计与实现  被引量:1

Research on Design and Implementation of Various Format Document Search Engine’s Index System

在线阅读下载全文

作  者:方跃胜[1] 董辉[2] 姚宏亮[3] 

机构地区:[1]安徽水利水电职业技术学院电子系,安徽合肥231603 [2]亳州职业技术学院信息工程系,安徽亳州236800 [3]合肥工业大学计算机与信息学院,安徽合肥230009

出  处:《长江大学学报(自科版)(上旬)》2012年第7期111-113,8,共3页JOURNAL OF YANGTZE UNIVERSITY (NATURAL SCIENCE EDITION) SCI & ENG

基  金:国家自然科学基金资助项目(60705015)

摘  要:随着Internet和计算机的迅猛发展,搜索引擎应需而生,越来越多的企业利用计算机处理运营过程中产生的大量电子文档。如何从这些网络和多格式文档资源中迅速、方便而准确地检索出企业用户所需的信息已成为越来越重要的问题。索引系统是搜索引擎的核心,为提高系统的查全率和查准率,设计了一种适用于文档检索的数据库存储的索引结构并建立索引库来降低索引组织的复杂度,通过布尔逻辑和向量空间的组合模型实现对检索结果排序,以返回最优文档列表。该系统在Windows环境下采用PHP开发组件实现,能够提高检索文档的查全率和查准率。With the rapid development of Internet and computers,search engine appears as it is needed,more and more enterprises also begin to use computers to handle electronic documents.It has become a more and more important problem that how to retrieve the information users needed rapidly,conveniently and accurately from these network and various formats documents resources.But the index system is the coral technology,in order to improve recall and precision of the system,by describing index technology and retrieval model,an inverted index structure of 2d array of grouping database applied to document retrieval is designed,the database of index is constructed to reduce the complexity of the index organization effectively.Retrieval results are sorted,and optimal documents list is returned finally.The system is realized by using PHP development kits in windows environment.

关 键 词:文档搜索引擎 索引同步 检索模型 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象