基于词向量的化学领域知识发现初步研究  被引量:1

Preliminary Research on the Knowledge Discovery in Chemistry Based on the Word Embedding

在线阅读下载全文

作  者:王鑫[1] 吉久明[1] 李楠[1] 孙济庆[1] Wang Xin;Ji Jiuming;Li Nan;Sun Jiqing(Institute of Science and Technology Information,East China University of Science and Technolog)

机构地区:[1]华东理工大学科技信息研究所

出  处:《图书馆杂志》2018年第11期90-98,共9页Library Journal

基  金:国家社科基金一般项目"面向知识服务的学科领域术语语义分析及应用研究"(项目编号:13BTQ053);教育部人文社会科学研究一般项目"面向语义出版的富语义模型构建与应用研究"(项目编号:15YJC870014)的研究成果之一

摘  要:在文本数据中,知识的表示具有抽象性、非结构化[1]、潜在性等特点,通过共现[2]、规则[3]和关联[4]等数据挖掘方式很难在体现词的语义性和句子的语法性下进行知识发现工作。本文在Word2Vec的基础上提出添加词属性的WP-Word2Vec模型,并依据词向量设计知识发现模型。通过实验表明WP-Word2Vec模型在训练词向量时能够融入词类别信息,在相应的相似词发现中相似度有所提高。In the text data, knowledge representation is abstract, unstructured, and latent. It is difficult to find knowledge by co-occurrence, rule or association. Based on Word2 Vec, this paper proposes to utilize the WP-Word2 Vec model with word attribute, and designs knowledge discovery model based on word vector. Experiments show that the WP-Word2 Vec model can integrate word class information into the training word vector, and the similarity in the similar word discovery is improved.

关 键 词:词素 词向量 word2vec 知识发现 

分 类 号:O6-05[理学—化学] G254[文化科学—图书馆学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象