检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:周艳平[1] 李金鹏 ZHOU Yanping;LI Jinpeng(College of Information Science and Technology,Qingdao University of Science and Technology,Qingdao 266061,China)
机构地区:[1]青岛科技大学信息科学技术学院,山东青岛266061
出 处:《青岛科技大学学报(自然科学版)》2020年第6期93-98,共6页Journal of Qingdao University of Science and Technology:Natural Science Edition
基 金:国家自然科学基金项目(61402246).
摘 要:针对句子的词序问题,提出了一种基于词向量及位置编码的Jaccard相似度算法。该方法首先使用词向量模型将每个词映射成高维语义向量,然后结合词位置编码计算出各个词向量的相似度,最后使用Jaccard算法计算出句子之间最终的相似度。实验结果证明:本工作提出的方法与传统的Jaccard算法和基于词向量的Jaccard相似度算法相比,有效提升了相似度准确率,对词序也有很好的辨别能力。In terms of word order problem for sentences,this paper proposes a Jaccard similarity algorithm based on word embedding and position encoding.Firstly,the word vector model is used to map each word into a high-dimensional semantic vector,and then the similarity of each word vector is calculated by combining the word position encoding.Finally,the final similarity between sentences is calculated by Jaccard algorithm.The experimental results show that compared with the traditional Jaccard algorithm and Jaccard text similarity algorithm based on word embedding,the proposed method effectively improves the similarity accuracy and has good discriminating ability for word order.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.171