基于字符长度的朝汉双语语料库的构建  被引量:1

在线阅读下载全文

作  者:王琪 

机构地区:[1]长春金融高等专科学校,吉林长春130124

出  处:《长江信息通信》2022年第11期57-59,共3页Changjiang Information & Communications

摘  要:句子级双文本语料库,已经成为机器翻译、双语词典编纂研究不可或缺的重要资源。目前,针对朝鲜语—汉语的相关研究比较少,文章面向朝汉平行语料库,采用基于字符长度的朝汉句子对齐算法,实现朝鲜语—汉语的句子的自动对齐,并提出一种句子对齐评价方法。实验表明,基于长度的句子对齐方法对朝汉句子自动对齐具有良好效果,句子对齐正确率达到88.7%,所提出的句子对齐判定方法简便有效,对构建朝汉双语语料库有重要的指导作用。

关 键 词:朝汉句子对齐 平行语料 句子对齐判定 jaccard系数 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象