企业非结构化数据检索研究  被引量:6

Research on enterprise unstructured data retrieval

在线阅读下载全文

作  者:徐树振[1] 罗学礼 王森 杨莉 段嘉杰 张德刚 

机构地区:[1]昆明理工大学云南电网公司研究生工作站,昆明650217 [2]云南电力试验研究院(集团)有限公司电力研究院,昆明650217 [3]云南电力试验研究院(集团) 有限公司电力研究院,昆明650217

出  处:《信息技术》2014年第4期196-200,共5页Information Technology

摘  要:随着信息化的高速发展,企业内部各业务系统中非结构化数据的数据量急剧膨胀,使得信息的搜索工作变得极为繁琐。建设该企业级非结构化数据检索平台,在Linux计算机集群上部署Hadoop开发框架以及Solr全文检索系统,将各业务系统中的非结构化数据进行集中式的存储、管理,并且提供统一的搜索服务。介绍了Solr的原理,并使用它搭建非结构化数据的中文搜索引擎,通过测试证明了该搜索引擎具有良好的搜索性能。通过检索平台,用户能够快速而高效地获取精确的搜索结果。With the rapid development ot lntormauon tecnnology, votume u business systems within the enterprise expands rapidly, making the search for information extremely cumbersome. An unstructured data retrieval platform for the entire enterprise, which is built by deploying on a Linux computer cluster with Hadoop development framework and Solr full text retrieval system. The platform centralizes storage and management of the unstructured data from each business system, and provides a unified search service. This paper introduces the principle of Solr, and a Chinese search engine for unstructured data is built with Solr. The test proved that the search engine has a good search performance. By the retrieval platform, users can quickly and efficiently get accurate search results.

关 键 词:SOLR 非结构化数据 HADOOP 搜索引擎 全文检索 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象