检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]宁夏大学计算机网络管理中心,宁夏银川750021 [2]东华大学旭日工商管理学院,上海200051 [3]宁夏地税局信息中心,宁夏银川750002
出 处:《宁夏大学学报(自然科学版)》2013年第1期54-57,共4页Journal of Ningxia University(Natural Science Edition)
基 金:宁夏高等学校科学技术研究基金资助项目(NXGXZR201107);宁夏大学科学研究基金资助项目(NDZR1066)
摘 要:根据校园舆情和信息安全管理的需要,结合垂直搜索的特点,提出了一种面向主题的域内垂直搜索引擎模型.给出了模型在信息采集、分词处理、主题识别、网页索引、检索处理5个功能模块的实现过程,并对模型涉及的中文分词方法、隐形关键词组的扩展运算、检索正态化因子的调整等关键技术进行了讨论.建成的搜索引擎能够很好地满足用户主题检索服务的需要.According to the requirement of management in public sentiment and information security, and combining the characteristics of vertical search, a model of subject-oriented intra-domain vertical search engine system is proposed. The model describes the implementations of five functional modules, which includes information collection, words segmentation processing, topic identification, index instruction and information retrieval. Some key technologies are discussed in the model, including the method of Chinese words segmentation, the extended operation of invisible key words and the adjustment of normalization factors. Practical application shows that the model search works well.
关 键 词:垂直搜索 向量空间模型 主题相关度 LUCENE
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.30