检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:赞拉公 安见才让[1] ZAN Lagong;AN Jiancairang
机构地区:[1]青海民族大学计算机学院,青海西宁810007
出 处:《信息技术与信息化》2023年第12期102-106,共5页Information Technology and Informatization
基 金:省部共建藏语智能信息处理及应用国家重点实验室、青海省藏文信息处理与机器翻译重点实验室基金项目(No.2021-Z-001);青海民族大学2023年度校级本硕博(学生)项目“基于深度学习的汉藏政府公文机器翻译技术研究”(No.09M2023005)。
摘 要:针对汉藏政府公文机器翻译的数据稀疏和构建大规模的语料库等关键问题,提出了一种基于规则的句级语料对齐技术。所提出的技术以汉藏政府公文的句子特点为依据,结合了基于长度和词汇的混合式对齐方法,在国家和省级层面的5个汉藏政府公文数据集上进行了测试,测试结果表明,准确率在66%到75%之间,减少了句级语料对齐所需的人力、物力和财力,同时在构建大规模语料上取得了较好的效果。
关 键 词:语料对齐工具 汉藏平行语料库 句级语料 汉藏机器翻译 辅助翻译
分 类 号:H085[语言文字—语言学] H214[自动化与计算机技术—计算机应用技术] TP391.2[自动化与计算机技术—计算机科学与技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.49