检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:徐曜[1] 赵政文[1] 陈群[1] 刘海龙[1] 杜晶[1] 胡嘉琪[1] 李战怀[1]
出 处:《计算机科学》2014年第5期219-222,共4页Computer Science
基 金:国家973课题(2012CB316203);自然基金重点项目(61033007);国家863项目(2012AA011004);西北工业大学研究生种子基金(Z2013125;Z2013126)资助
摘 要:现阶段,用户常常希望利用搜索引擎获得期望的实体,然而传统搜索引擎只能返回包含关键字的多个文档,并不能直接返回用户想要的答案,且现有的实体排序技术主要采用权值叠加的方法,需要很多先验知识对权值进行训练。文中从搜索引擎返回的文档中提取多个候选实体,并提出一种基于图结构的算法PERA(Probabilistic Entity Ranking Algorithm),利用随机游走的思想,在不需要知道相关先验知识的情况下,将候选实体排序。经过实验验证,各个类型的正确实体均有着较高的排序分值。In recent decades,users tend to get expected entities directly.Unfortunately,traditional search engine can only return some documents related to the key words instead of the entities user expect What's worse,most state-of-art entity ranking methods adopt the approach of weight stack by considering some factors related to the entities,and need many priori knowledge to train the weights.This paper extracted several candidate entities from the snippets returned by search engine and exploited the ideology of "Random Walk" to raise a graph-based algorithm,PERA(Probabilistic Entity Ranking Algorithm),to rank the candidates without many priori knowledge.The results of experiments show that the target entity gets a high ranking score.
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.147