检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]湖南大学嵌入式系统及网络实验室,长沙410082 [2]淘宝(中国)有限责任公司,杭州315100
出 处:《电信科学》2011年第11期51-56,共6页Telecommunications Science
基 金:国家自然科学基金资助项目(No.60873074);国家工业和信息化部核高基金资助项目(No.2009ZX01038-001)
摘 要:实时搜索已成为信息检索领域的热点问题之一。传统搜索引擎在分布式环境下无法保证大数据量、高并发情况下的实时响应和数据容灾。本文提出了一种基于Solr的分布式实时搜索模型,分析了其实现原理。模型通过内存索引与磁盘索引相结合保证索引信息的实时展示,同时引入CommitLog日志保证内存索引数据容灾,并通过Master/Slave模型保证搜索服务的可用性。最终应用于实际生产系统中,实践结果充分证明了该模型的可行性。Real-time search is a hot spot in research of information retrieval.In the distributed environment of big data and high concurrent,traditional search engine can not guarantee to make real-time response and data disaster tolerance.In this paper,we proposes a distributed real-time search engine model based on Solr,then explaines the principle and the procedures in detail.The memory index and disk index are integrated organically to present information in time.We brings out CommitLog to ensure memory index metadata disaster tolerance.Master/Slave model carry guarantee of high availability of search service.Practice has proved its feasibility.
关 键 词:信息检索 分布式实时搜索模型 SOLR 数据容灾
分 类 号:TP393.4[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.28