一种基于图结构的Web实体排序方法  

Graph-based Web Entity Ranking Method

在线阅读下载全文

作  者:徐曜[1] 赵政文[1] 陈群[1] 刘海龙[1] 杜晶[1] 胡嘉琪[1] 李战怀[1] 

机构地区:[1]西北工业大学计算机学院,西安710129

出  处:《计算机科学》2014年第5期219-222,共4页Computer Science

基  金:国家973课题(2012CB316203);自然基金重点项目(61033007);国家863项目(2012AA011004);西北工业大学研究生种子基金(Z2013125;Z2013126)资助

摘  要:现阶段,用户常常希望利用搜索引擎获得期望的实体,然而传统搜索引擎只能返回包含关键字的多个文档,并不能直接返回用户想要的答案,且现有的实体排序技术主要采用权值叠加的方法,需要很多先验知识对权值进行训练。文中从搜索引擎返回的文档中提取多个候选实体,并提出一种基于图结构的算法PERA(Probabilistic Entity Ranking Algorithm),利用随机游走的思想,在不需要知道相关先验知识的情况下,将候选实体排序。经过实验验证,各个类型的正确实体均有着较高的排序分值。In recent decades,users tend to get expected entities directly.Unfortunately,traditional search engine can only return some documents related to the key words instead of the entities user expect What's worse,most state-of-art entity ranking methods adopt the approach of weight stack by considering some factors related to the entities,and need many priori knowledge to train the weights.This paper extracted several candidate entities from the snippets returned by search engine and exploited the ideology of "Random Walk" to raise a graph-based algorithm,PERA(Probabilistic Entity Ranking Algorithm),to rank the candidates without many priori knowledge.The results of experiments show that the target entity gets a high ranking score.

关 键 词:WEB 实体排序 搜索引擎  

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象