检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:张孝飞[1] 陈肇雄[1] 黄河燕[1] 王建德[1]
机构地区:[1]中国科学院计算机语言信息工程研究中心,北京100083
出 处:《小型微型计算机系统》2006年第2期330-334,共5页Journal of Chinese Computer Systems
基 金:国家自然科学基金项目(60272088;60502048)资助;国家"八六三"计划基金项目(2002AA117010-02)资助
摘 要:双语词对齐是指在源、译文中找到词汇级的对译关系,是自然语言处理领域一个非常有用而又比较困难的研究课题,其中涉及词法、语法、语义以及英汉语言间的固有差异和翻译习惯等诸多问题.文章在词法分析的基础上,利用有限的语言资源(主要只使用了一部双语词典),采取多级匹配和消歧策略,将词对齐问题转化为迭代求解锚点词对的过程,使得词对齐既有较高的准确率又有较高的召回率.经过对真实语料的测试,词对齐准确率达93.0%,召回率达77.3%,F值达84.2%,基本上满足了有关应用的实际要求.Word-alignment algorithm is to find the corresponding translation of words between the source language sentence and the target language sentence. It is a very useful and difficult task which involves in many problems such as accordance,syntax, sementics and inherent difference between and English and Chinese ,and human's translation habits,etc. In this paper ,a new algorithm is proposed based on accidence analysis: the word-alignment problem is transformed to an iterative solution of anchor word-pair by multi-level match and disambiguity algorithm which only use a bilingual dictionary. The experiment results show that the word-alignment precision is 93. 0% ,recall is 77.3%and F-score is 84.2%.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.36