基于SimRank的百度百科词条语义相似度计算  被引量:10

Semantic similarity computation of Baidu encyclopedia entries based on SimRank

在线阅读下载全文

作  者:尹坤[1] 尹红风[1] 杨燕[1] 贾真[1] 

机构地区:[1]西南交通大学信息科学与技术学院,四川成都610031

出  处:《山东大学学报(工学版)》2014年第3期29-35,共7页Journal of Shandong University(Engineering Science)

基  金:国家自然科学基金资助项目(61152001;61170111);中国科学院自动化研究所复杂系统管理与控制重点实验室开放课题资助项目(20110102);中央高校基本科研业务费专项资金资助项目(SWJTU11ZT08)

摘  要:提出一种利用百度百科半结构化数据自动获取词语相似度的方法,该方法将百科词条与其相关词条看做有向图的两个节点,且两节点相互之间存在着链接关系,然后利用SimRank算法计算百科词条语义相似度。实验表明,该方法优于传统的词语语义相似度测量,能准确地反映词语之间的语义关系。The measurement of the semantic similarity using semi-structured data on Baidu encyclopedia was proposed. The encyclopedia entries and related entries were considered as two nodes of a directed graph, of which there was a link between two nodes.Then SimRank algorithm was used to calculate the semantic similarity of encyclopedia entries.Experimental results showed that the proposed measure significantly outperformed the traditional similarity measures, and might accurately reflect the semantic relationship between words.

关 键 词:语义相似度 百科词条 有向图 SIMRANK 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象