检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:牛翊童
机构地区:[1]太原科技大学晋城校区
出 处:《计算机产品与流通》2020年第8期249-249,255,共2页
摘 要:该文提出一种基于知识图谱的面向英文命名实体的消歧方法,该方法提取英文维基百科文章的简介部分,对简介部分预处理之后,使用SpaCy库来识别简介中的所有命名实体,接着利用锚文本频率和simHash两种方法实现候选集的生成,为了证明该方法的有效性,本文构建相应模型,将文本中的词转化为词向量输入双向LSTM,将其输出与知识图谱向量,一起作为前馈神经网络的输入,最终得到对应的真实实体。最后,在一个小规模测试集上进行了实验,与基准相比,准确率提高了8%。
关 键 词:命名实体消歧 英文维基百科 锚文本 simHash
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.31