基于锚点信息和句子长度相结合的汉藏句子对齐方法研究  被引量:2

在线阅读下载全文

作  者:才藏太[1] 索南才让[1] 

机构地区:[1]青海师范大学计算机学院,青海西宁810008

出  处:《青海师范大学民族师范学院学报》2016年第1期91-93,共3页Journal of Teachers College for Nationalities Qinghai Normal University

基  金:国家自然科学基金"藏历算法模型及其自动推算系统研究"(No.61550006);国家社科基金"面向信息处理的藏语短语研究"(No.15BYY167)的阶段成果

摘  要:语料库资源对于自然语言处理研究的巨大价值已经得到社会各界越来越多的认可。特别是句子级对齐的双语平行语料库,已经成为机器翻译、翻译知识获取以及双语词典编纂研究不可或缺的重要资源。本文结合青海省科技厅项目《汉藏句子自动对齐技术研究》的研究经验,提出了一种利用句子长度和锚点信息相结合的汉藏双语句子对齐方法,该方法利用(1:1)型的句珠作为候选锚点,用锚点将双语文本分割成几个分块,在对应双语分块中用基于长度的对齐实现句子的对齐。

关 键 词:藏文句子 句子对齐 锚点 双语文本图 

分 类 号:H146[语言文字—汉语] H214

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象