检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:李卓 王志娟[1,2] 赵小兵 LI Zhuo;WANG Zhijuan;ZHAO Xiaobing(School of Information Engineering,Minzu University of China,Beijing 100081,China;Natural Language Resource Monitoring and Research Center of Minority Languages,Beijing 100081,China;Institute of Scientific and Technical Information of China,Beijing 100038,China)
机构地区:[1]中央民族大学信息工程学院,北京100081 [2]国家语言资源监测与研究少数民族语言中心,北京100081 [3]中国科学技术信息研究所,北京100038
出 处:《中文信息学报》2024年第7期1-17,共17页Journal of Chinese Information Processing
基 金:国家语委项目(ZDI145-61)。
摘 要:机器音译是基于语音相似性自动将文本从一种语言转换为另一种语言的过程,其是机器翻译的一个子任务,侧重于语音信息的翻译。音译后可知道源单词在另一种语言中的发音,使不熟悉源语言的人更容易理解该语言,有益于消除语言和拼写障碍。机器音译在多语言文本处理、语料库对齐、信息抽取等自然语言应用中发挥着重要作用。该文阐述了目前机器音译任务中存在的挑战,对主要的音译方法进行了剖析、分类和整理,对音译数据集进行了罗列汇总,并列出了常用的音译效果评价指标,最后对该领域目前存在的问题进行了说明,并对音译学的未来进行了展望。该文旨在为进入该领域的新人提供快速的入门指南,或供其他研究者参考。Machine transliteration refers to the process of automatically converting text from one language into another according to the phonetic information.Machine transliteration plays an important role in natural language applications such as multilingual text processing,corpus alignment,and information extraction.This paper investigates the challenges existing in the current machine transliteration tasks,summarizes the main transliteration methods,elaborates the transliteration data sets,and reviews the popular evaluation metrics of transliteration.The existing problems are outlined,and the future research directions of transliteration are discussed.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.249