维汉机器翻译用电子词典的设计  被引量:3

Design of a Dictionary for Uighur-Chinese Machine Translation System

在线阅读下载全文

作  者:阿里甫.库尔班 阿布力米提.阿不都热依木 吐尔根.依布拉音 

机构地区:[1]新疆大学信息科学与工程学院,乌鲁木齐830046

出  处:《计算机工程与应用》2006年第20期76-78,共3页Computer Engineering and Applications

基  金:国家自然科学基金资助项目(编号:60263004)

摘  要:电子词典是在机器翻译系统中包含的信息量最大的一个部件,电子词典包的质量和容量直接限定机器翻译的质量和应用范围。与一般的电子词典不同,机器翻译词典每个词条都要比一般的电子词典增加词类信息、语义类别信息和成语等。文章以频率统计和频率分布统计作为维汉机器翻译词典的词条收录原则,统计维吾尔文中常用的单词数目,论述维汉机器翻译词典的设计思想,用BNF形式语言和Jackson图描述维汉机器翻译词典应包含的词条信息,最后介绍词典的具体构造方法、词条排序原则、索引表和属性库的数据结构和词典信息的查找方法。试验表明该词典在解决维吾尔语词汇歧义、结构歧义、提高汉语译文准确率等方面较为有效。Electronic Dictionary is the largest component of a Machine Translation system in the terms of the information it holds.The quality and size of the electronic dictionary limits the scope and coverage of a Machine Translation system.What makes the MT dictionary different from the generic dictionary is that each word contained in MT dictionary should have corresponding information for part of speech,semantics and idioms in which this word occurs.This paper statistics the number of commonly used Uighur words using word frequency statistics and frequency distribution statistics,discusses the design principal,describes the structure of the word information contained in the MT dictionary using BNF formation and Jackson chart,finally introduces construction and data structure,word sorting method,structure of index table and attribute library and search method of an electronic dictionary for Uighur-Chinese MT system.Experimental evidence indicates that this lexicon has obvious efficiency in lexical disambiguation,syntactical disambiguation,and improvement of accuracy of target language translation.

关 键 词:维吾尔文 汉文 机器翻译 电子词典 

分 类 号:TP391.2[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象