机器翻译中汉语词语切分的现状——汉语分词与汉英机器翻译研究系列之一  被引量:4

The Status Quo of Chinese Word Segmentation in Machine Translation

在线阅读下载全文

作  者:吴志杰[1] 

机构地区:[1]南京理工大学外语系,江苏南京210094

出  处:《外语研究》2009年第1期8-13,共6页Foreign Languages Research

基  金:南京理工大学科技发展基金项目"汉语分词与汉英机器翻译研究"的资助;项目编号:XKF09052

摘  要:汉语词语的切分是汉语自然语言处理和汉外机器翻译研究的一个难题。本文首先回顾了汉语词语切分的历史,评述了其主要的技术,然后对现有的汉英翻译软件的汉语分词系统进行测评。文章显示,汉语作为一种意合型、语用型语言的特点可以部分地解释为何现有机器翻译软件中的语言规则型或统计型的切分系统不能很好地进行分词。As the Chinese language is written without marked word boundaries,word segmentation is always a hard nut to crack in machine translation (MT) studies. The present paper reviews existing scholarship on Chinese word segmentation (CWS) and then proceeds to evaluate the CWS systems in Chinese-English MT programs avaliable presently. The author argues that the Chinese language is basically a pragmatically-oriented language,which partly explains the difficulties faced by existing CWS systems in MT,either linguistically oriented or statistically oriented.

关 键 词:汉语词语切分 机器翻译 语用型语言 

分 类 号:H059[语言文字—语言学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象