检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]上海财经大学 [2]上海外国语大学图书馆
出 处:《图书馆杂志》2016年第12期17-22,62,共7页Library Journal
摘 要:词袋模型是一种最原始且普遍适用的关联数据融合算法,但是该算法中关键词匹配未利用自身语义以及语料库不足等现象,造成实体链接准确率不高。本文提出使用知识库作为背景,利用语义扩展和循环迭代来增强实体消歧的速度和准确率。该算法分为两个过程,首先对关联数据集进行初步的语义融合,然后在此基础上,利用本文提出的语义循环迭代词袋(s-i-Bo W)算法实现实体的消歧与链接。实验通过与基于传统词袋算法的关联数据融合进行了对比,证明了本文提出的语义循环迭代词袋算法具备更优的关联数据融合效果。Bag of words model is one of the most primitive linked data fusion algorithm, but the algorithm does not use its own semantic keyword for matching and corpus is inadequate, resulting in low accuracy rate of entity link.This paper proposes the use of semantic knowledge base, the use of semantic extension and loop iterations to enhance the speed and accuracy of entity disambiguation. The algorithm includes two processes. First, linked data sets should go through preliminary semantic integration, on the basis of which, the proposed s-i-BoW algorithm should be utilized to remove the entity ambiguation and links. After comparing with the result received from traditional bag of words model, the paper proves the better effect and efficiency of the proposed s-i-BoW algorithm.
关 键 词:词袋模型 BOW 关联数据融合 实体链接 实体消歧
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.16.68.255