基于俄汉政治外交平行语料库的短语对应单位抽取研究  被引量:5

Extraction Parallel Phrases from Russian-Chinese Parallel Corpus in the Field of Politics and Diplomacy

在线阅读下载全文

作  者:原伟 YUAN Wei

机构地区:[1]信息工程大学洛阳校区,河南洛阳471003

出  处:《解放军外国语学院学报》2020年第5期38-45,共8页Journal of PLA University of Foreign Languages

基  金:国家社会科学基金项目“基于本体的俄汉可比语料库构建与评估”(14CYY051);国家社会科学基金项目“基于可比语料库和本体的俄汉网络新闻话题监测与情感识别研究”(18BYY235)。

摘  要:从平行句对中自动抽取短语对应单位,能够使平行语料库更好地用于词典编纂、机器翻译以及翻译教学等领域。本文构建了政治外交领域俄汉平行语料库(句对27664对,2010632字/词),依照所设计的俄汉短语切分规则和构成模式统计并获得了单语种短语,并基于短语长度、词典、机器翻译三维评估模型实现了短语对应单位的自动对齐(215373对短语)。通过将自动处理结果与人工标注结果进行对比评估,证明了语料库的实用性和短语对应单位抽取方法的准确性和有效性(完全对齐56.43%,部分对齐31.91%)。该研究为基于平行语料库的短语对应单位抽取提供了可行的研究思路和方法借鉴,对翻译学、词典学和语料库语言学研究均有启示意义。

关 键 词:俄语 政治外交 平行语料库 短语 对应单位 

分 类 号:H356[语言文字—俄语]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象