检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:王路路 斯拉吉艾合麦提.如则麦麦提 艾山.吾买尔[1,2] 吐尔根.依布拉音 买合木提.买买提 卡哈尔江.阿比的热西提 WANG Lulu;Silajiaihemaiti Ruzemaimaiti;Aishan Wumaier;Tuergen Yibulayin;Maihemuti Maimaiti;Kahaerjiang Abiderexiti(School of Information Science and Engineering,Xinjiang University,Urumqi 830046,China;Xinjiang Laboratory of Multi.Language Information Technology,Urumqi 830046,China)
机构地区:[1]新疆大学信息科学与工程学院,新疆乌鲁木齐830046 [2]新疆多语种信息技术实验室,新疆乌鲁木齐830046
出 处:《现代电子技术》2018年第24期101-105,共5页Modern Electronics Technique
基 金:国家"973"计划资助项目(2014CB340506);国家自然科学基金资助项目(61331011);国家自然科学基金资助项目(61262060);国家自然科学基金资助项目(61662077);国家自然科学基金资助项目(61462083);新疆多语种信息技术实验室开放课题(2016D03023);"自治区青年科技创新人才培养工程"青年博士项目(QN2015BS004)~~
摘 要:为解决将汉语人物简历翻译成维吾尔语版本所面临的高成本、低效率等问题,设计并实现了一种基于模板与词典相结合的人物简历汉维机器翻译系统。通过分析汉语简历的句子结构特点,泛化命名实体并自动创建汉语的简历模板,然后利用正则表达式建立汉维模板库并结合基于规则与词典的方法翻译命名实体,以获取维吾尔语的人物简历。实验结果表明,该系统在单语的情况下使用有限的模板和词典,BLUE值可达到0.38,与需要大规模双语语料训练的机器翻译系统相比具有较好的实际应用价值。A Chinese-Uyghur machine translation system based on the combination of templates and dictionaries is de-signed and implemented for personage resumes to resolve the problems of high cost and low efficiency of translating the Chinese personage resume into the Uyghur version.The named entities are generalized,and the Chinese resume templates are automati-cally created by analyzing the sentence structure characteristics of Chinese resumes.A Chinese-Uyghur template library is estab-lished by using regular expressions.The named entities are translated by combining with the method based on rules and diction-aries,so as to obtain the Uyghur personage resumes.The experimental results show that the system uses limited templates and dictionaries in the monolingual situation,its BLUE value can reach 0.38,and in comparison with the machine translation sys-tems that require large-scale bilingual corpora training,the system has a better practical application value.
关 键 词:人物简历 汉维机器翻译 模板库 命名实体 正则表达式 句子结构
分 类 号:TN912.3-34[电子电信—通信与信息系统] TP391[电子电信—信息与通信工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.74