基于词向量的越汉跨语言事件检索研究  被引量:3

Word Vector Based Cross Lingual Event Retrieval for Vietnamese and Chinese

在线阅读下载全文

作  者:唐亮 席耀一 彭波 刘香伟 易绵竹[1] TANG Liang;XI Yaoyi;PENG Bo;LIU Xiangwei;YI Mianzhu(Department of Language Engineering, PLA University of Foreign Language, Luoyang, Henan 471003, China)

机构地区:[1]解放军外国语学院语言工程系,河南洛阳471003

出  处:《中文信息学报》2018年第3期64-70,共7页Journal of Chinese Information Processing

基  金:国家重点基础研究发展计划(973计划)(2014CB340400;2012CB316303);国家自然科学基金(61232010;61173064);国家科技支撑计划(2012BAH39B04)

摘  要:为了解决越汉跨语言事件检索中的查询翻译问题,该文提出了一种基于词向量的越汉跨语言事件检索方法。首先利用词向量构建事件关键词的汉语语义特征向量,然后计算越语的事件关键词的特征翻译向量,最后通过计算语义特征向量之间的相似度完成跨语言关键词对齐,从而实现查询关键词的自动翻译,进而完成跨语言事件检索。在构建的南海话题相关越汉语料库上进行的实验证明了该方法的有效性。This paper proposes a novel word vector based cross lingual event retrieval method for Vietnamese and Chinese.First,the Chinese event keywords are computed for their semantic feature vector via the word vector.Then,the corresponding Vietnamese translation vectors are computed.Finally,the cross-language keyword alignment is calculated via the similarity between the two semantic feature vector spaces.The input query can thus be mapped into the other language,and the cross lingual event retrieval is realized.Experiments on the South China Sea events related Vietnamese-Chinese bilingual corpus have shown the effectiveness of the method.

关 键 词:词向量 跨语言检索 关键词对齐 语义特征向量 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象