汉藏政府公文机器翻译的语料对齐技术研究  被引量:1

在线阅读下载全文

作  者:赞拉公 安见才让[1] ZAN Lagong;AN Jiancairang

机构地区:[1]青海民族大学计算机学院,青海西宁810007

出  处:《信息技术与信息化》2023年第12期102-106,共5页Information Technology and Informatization

基  金:省部共建藏语智能信息处理及应用国家重点实验室、青海省藏文信息处理与机器翻译重点实验室基金项目(No.2021-Z-001);青海民族大学2023年度校级本硕博(学生)项目“基于深度学习的汉藏政府公文机器翻译技术研究”(No.09M2023005)。

摘  要:针对汉藏政府公文机器翻译的数据稀疏和构建大规模的语料库等关键问题,提出了一种基于规则的句级语料对齐技术。所提出的技术以汉藏政府公文的句子特点为依据,结合了基于长度和词汇的混合式对齐方法,在国家和省级层面的5个汉藏政府公文数据集上进行了测试,测试结果表明,准确率在66%到75%之间,减少了句级语料对齐所需的人力、物力和财力,同时在构建大规模语料上取得了较好的效果。

关 键 词:语料对齐工具 汉藏平行语料库 句级语料 汉藏机器翻译 辅助翻译 

分 类 号:H085[语言文字—语言学] H214[自动化与计算机技术—计算机应用技术] TP391.2[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象