检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:吴志杰[1]
出 处:《外语研究》2009年第1期8-13,共6页Foreign Languages Research
基 金:南京理工大学科技发展基金项目"汉语分词与汉英机器翻译研究"的资助;项目编号:XKF09052
摘 要:汉语词语的切分是汉语自然语言处理和汉外机器翻译研究的一个难题。本文首先回顾了汉语词语切分的历史,评述了其主要的技术,然后对现有的汉英翻译软件的汉语分词系统进行测评。文章显示,汉语作为一种意合型、语用型语言的特点可以部分地解释为何现有机器翻译软件中的语言规则型或统计型的切分系统不能很好地进行分词。As the Chinese language is written without marked word boundaries,word segmentation is always a hard nut to crack in machine translation (MT) studies. The present paper reviews existing scholarship on Chinese word segmentation (CWS) and then proceeds to evaluate the CWS systems in Chinese-English MT programs avaliable presently. The author argues that the Chinese language is basically a pragmatically-oriented language,which partly explains the difficulties faced by existing CWS systems in MT,either linguistically oriented or statistically oriented.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222