检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]江西理工大学现代教育技术及信息中心,江西赣州341000 [2]江西师范大学计算机信息工程学院,江西南昌330022 [3]江西科技师范大学,江西南昌330038
出 处:《山西大学学报(自然科学版)》2014年第1期12-18,共7页Journal of Shanxi University(Natural Science Edition)
基 金:国家自然科学基金(61272212);2012年江西省自然科学青年基金(20122BAB211032);2013年江西省高校人文社会科学青年基金(JC1312)
摘 要:传统的查询扩展技术大都依据单个查询词的相关性来扩展查询词,忽略了查询词之间的相关性以及查询扩展词的不同重要程度,使得扩展效果不佳。针对此问题,提出了一种基于PageRank算法的查询扩展模型,该模型在Markov网络检索模型的基础上,从查询本身出发,将所有与查询相关的词组成Markov查询关联子网,在此子网上应用PageRank算法来计算候选扩展词的权重,由权重序来确定扩展词的选取,排名前列的扩展词进入检索阶段,消除噪音,提高检索效率。在标准数据集上的实验结果表明,本文提出的模型能有效地改善检索效果。In traditional query expansion technology, if a term associates with a single query term, then it will be chosen as expansion term, the whole concept is rarely taken into account, even the expansion terms have the same impact on retrievaling documents. In order to solve the problem,this paper proposes a novel expansion method based on PageRank algorithm, which is built on the basis of markov network information retrieval model. By the PageRank random walk process, voting for the candidate expansion terms, and selec- ting the top ranking terms as the high quality expansion terms. The experimental results show that Markov retrieval expanded model based on PageRank algorithm is outperformed compared with the markov basic expansion model.
关 键 词:查询扩展 MARKOV网络 PAGERANK算法 信息检索
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.15