面向主题的域内垂直搜索引擎系统的研究与实现  

Research and Implementation of Subject-oriented Intra-domain Vertical Search Engine System

在线阅读下载全文

作  者:王恒[1,2] 王少山 高玉琢[1] 

机构地区:[1]宁夏大学计算机网络管理中心,宁夏银川750021 [2]东华大学旭日工商管理学院,上海200051 [3]宁夏地税局信息中心,宁夏银川750002

出  处:《宁夏大学学报(自然科学版)》2013年第1期54-57,共4页Journal of Ningxia University(Natural Science Edition)

基  金:宁夏高等学校科学技术研究基金资助项目(NXGXZR201107);宁夏大学科学研究基金资助项目(NDZR1066)

摘  要:根据校园舆情和信息安全管理的需要,结合垂直搜索的特点,提出了一种面向主题的域内垂直搜索引擎模型.给出了模型在信息采集、分词处理、主题识别、网页索引、检索处理5个功能模块的实现过程,并对模型涉及的中文分词方法、隐形关键词组的扩展运算、检索正态化因子的调整等关键技术进行了讨论.建成的搜索引擎能够很好地满足用户主题检索服务的需要.According to the requirement of management in public sentiment and information security, and combining the characteristics of vertical search, a model of subject-oriented intra-domain vertical search engine system is proposed. The model describes the implementations of five functional modules, which includes information collection, words segmentation processing, topic identification, index instruction and information retrieval. Some key technologies are discussed in the model, including the method of Chinese words segmentation, the extended operation of invisible key words and the adjustment of normalization factors. Practical application shows that the model search works well.

关 键 词:垂直搜索 向量空间模型 主题相关度 LUCENE 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象