面向地学信息领域垂直搜索引擎设计与实现  被引量:4

Design and implementation of vertical search engine for field of geosciences

在线阅读下载全文

作  者:张思发[1] 马永格[1] 

机构地区:[1]中国地质大学计算机学院,武汉430074

出  处:《计算机工程与应用》2012年第33期85-88,95,共5页Computer Engineering and Applications

基  金:国家自然科学基金(No.2011093051);中国博士后科学基金(No.2011M501260);湖北省自然科学基金(No.2010CDB04104)

摘  要:垂直搜索引擎是搜索引擎领域的行业化分工,根据地学信息领域的行业特征、整体需求及其工作流程,在Nutch开源搜索引擎平台上添加了"庖丁解牛"中文分词算法、主题相关度评分算法、"主题词管理"选项等技术,建立了基于网络蜘蛛模型的面向地学信息领域的垂直搜索引擎。经过测试及结果比较,该系统相对于通用搜索引擎有明显的优势,使地学信息的定位和查找更加准确。该系统具有良好的扩展性和通用性,对垂直搜索引擎的研究和开发具有一定的借鉴作用。Vertical search engines are the industrial division of comprehensive search engines,and in this paper,according to the industry characteristics,the overall demand and the workflow of geosciences field,the"Paodingjieniu" Chinese word segmentation algorithm,the subject-correlation judgment function and the"Subject Management" option are added to the Nutch system,thus establishing the vertical search engine for geosciences.The online test and result comparison show that this system has obvious advantages compared with universal search engines,making it more accurate to locate and search geo-information.Besides,the system has good extensibility and versatility,providing some reference to the vertical search engine research and development.

关 键 词:地学信息领域 垂直搜索引擎 NUTCH 中文分词 页面排序 主题词管理 

分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象