Word2vec的核心架构及其应用  被引量:69

The Architecture of Word2vec and Its Applications

在线阅读下载全文

作  者:熊富林 邓怡豪 唐晓晟[2] 

机构地区:[1]北京邮电大学信息与通信工程学院,北京100876 [2]北京邮电大学WTI实验室,北京100876

出  处:《南京师范大学学报(工程技术版)》2015年第1期43-48,共6页Journal of Nanjing Normal University(Engineering and Technology Edition)

摘  要:神经网络概率语言模型是一种新兴的自然语言处理算法,该模型通过学习训练语料获得词向量和概率密度函数,词向量是多维实数向量,向量中包含了自然语言中的语义和语法关系,词向量之间余弦距离的大小代表了词语之间关系的远近,词向量的加减代数运算则是计算机在"遣词造句".近年来,神经网络概率语言模型发展迅速,Word2vec是最新技术理论的合集.首先,重点介绍Word2vec的核心架构CBOW及Skip-gram;接着,使用英文语料训练Word2vec模型,对比两种架构的异同;最后,探讨了Word2vec模型在中文语料处理中的应用.Word2vec is a combination of neural probabilistic language model,which includes CBOW model and Skipgram model in terms of architecture. This paper will introduce the technology of Word2 vec. Firstly,the paper will elaborate the theory of Word2 vec architecture; secondly,an English corpus which is extracted from Wikipedia will be used to train the model,and a set of results will be shown; lastly,the application of Word2 vec in the language of Chinese will be explored,a result will also be presented precisely.

关 键 词:自然语言处理 Word2vec CBOW Skip-gram 中文语言处理 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象