检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]中国科学院自动化研究所数字内容技术研究中心,北京100190 [2]中国科学院自动化研究所模式识别国家重点实验室,北京100190
出 处:《中文信息学报》2009年第1期44-49,共6页Journal of Chinese Information Processing
基 金:国家863计划资助项目(2006AA01Z194)
摘 要:该文提出了一种基于加权有限状态转化器(WFST)的多模型融合人名翻译框架。该框架以两个基于字符的转换模型和两个基于发音的转换模型为核心,通过加权有限状态转换器将多模型进行融合实现对人名的翻译。与单个模型相比,该文提出的方法的优势在于通过从各种信息源得到的数据价值的最大化。实验结果表明,基于多模型融合方法的人名翻译的错误率比单一模型的人名翻译的错误率降低了7.14%。This paper proposes a novel framework for Chinese-English name back-transliteration based on multiple models by using weighted finite-state transducers (WFST). Two grapheme-based models and two phoneme-based models are kernel of this framework. Combining those models with unified framework of WFST, we can build a system for Chinese English name back transliteration. Compared with single-model systems, the advantage of this method lies in combining those information from different models and maximizing the data available. Our experiments show that the proposed framework reduces 7.14% in error rate compared with the single-model.
关 键 词:计算机应用 中文信息处理 多模型融合 音译 命名实体 加权有限状态转换器
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.15