基于多元相似度融合的中文命名实体消歧方法  被引量:2

Chinese Named Entity Disambiguation Based on Multivariate Similarity Fusion

在线阅读下载全文

作  者:石水倩 金晶 沈耕宇 王宝佳 任妮[1] Shi Shuiqian;Jin Jing;Shen Gengyu;Wang Baojia;Ren Ni(Institute of Agricultural Information,Jiangsu Academy of Agricultural Sciences,Nanjing 210014,China)

机构地区:[1]江苏省农业科学院农业信息研究所,南京210014

出  处:《数据分析与知识发现》2024年第2期56-64,共9页Data Analysis and Knowledge Discovery

基  金:国家社会科学基金项目(项目编号:19BTQ032)的研究成果之一。

摘  要:【目的】解决文本中多个不同含义的同名实体在映射到知识库时产生的歧义问题,提高实体消歧的准确率。【方法】提出一种多元相似度融合方法,考虑实体上下文的语义相似度、实体属性的背景相似度和主题词的主题相似度,对实体进行刻画。【结果】在维基百科农业方向数据集上的实验结果表明,本文所提方法准确率为89.7%,优于传统方法。【局限】方法仅在特定领域适用。【结论】本文所提多元相似度融合方法较传统方法和主流消歧方法具有更高的实体消歧准确率,能够解决特定领域的实体消歧问题,未来可将其应用于更广泛的实体消歧场景中。[Objective]This paper aims to solve the ambiguity problems arising from mapping multiple entities of the same name with different meanings to a knowledge base.It improves the accuracy of entity disambiguation.[Methods]We proposed a multi-dimensional similarity fusion method.It utilizes the semantic similarity of entity context,the entity attributes'background similarity,and the topic words'semantic similarity to characterize entities.[Results]We examined the new model on the agricultural dataset from Wikipedia.The proposed method achieved an accuracy of 89.7%,outperforming traditional methods.[Limitations]The proposed method is only applicable in specific fields.[Conclusions]The new method addresses the entity disambiguation issues in specific fields.It can be applied to a broader range of entity disambiguation scenarios.

关 键 词:实体消歧 相似度 上下文词向量 实体属性 主题词向量 

分 类 号:TP393[自动化与计算机技术—计算机应用技术] G250[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象