一种基于词向量及位置编码的Jaccard相似度算法  被引量:6

Jaccard Similarity Algorithm Based on Word Embedding and Position Encoding

在线阅读下载全文

作  者:周艳平[1] 李金鹏 ZHOU Yanping;LI Jinpeng(College of Information Science and Technology,Qingdao University of Science and Technology,Qingdao 266061,China)

机构地区:[1]青岛科技大学信息科学技术学院,山东青岛266061

出  处:《青岛科技大学学报(自然科学版)》2020年第6期93-98,共6页Journal of Qingdao University of Science and Technology:Natural Science Edition

基  金:国家自然科学基金项目(61402246).

摘  要:针对句子的词序问题,提出了一种基于词向量及位置编码的Jaccard相似度算法。该方法首先使用词向量模型将每个词映射成高维语义向量,然后结合词位置编码计算出各个词向量的相似度,最后使用Jaccard算法计算出句子之间最终的相似度。实验结果证明:本工作提出的方法与传统的Jaccard算法和基于词向量的Jaccard相似度算法相比,有效提升了相似度准确率,对词序也有很好的辨别能力。In terms of word order problem for sentences,this paper proposes a Jaccard similarity algorithm based on word embedding and position encoding.Firstly,the word vector model is used to map each word into a high-dimensional semantic vector,and then the similarity of each word vector is calculated by combining the word position encoding.Finally,the final similarity between sentences is calculated by Jaccard algorithm.The experimental results show that compared with the traditional Jaccard algorithm and Jaccard text similarity algorithm based on word embedding,the proposed method effectively improves the similarity accuracy and has good discriminating ability for word order.

关 键 词:位置编码 Jaccard算法 词向量 句子相似度 

分 类 号:TQ207.2[化学工程—有机化工]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象