检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:阿里甫.库尔班 阿布力米提.阿不都热依木 吐尔根.依布拉音
机构地区:[1]新疆大学信息科学与工程学院,乌鲁木齐830046
出 处:《计算机工程与应用》2006年第20期76-78,共3页Computer Engineering and Applications
基 金:国家自然科学基金资助项目(编号:60263004)
摘 要:电子词典是在机器翻译系统中包含的信息量最大的一个部件,电子词典包的质量和容量直接限定机器翻译的质量和应用范围。与一般的电子词典不同,机器翻译词典每个词条都要比一般的电子词典增加词类信息、语义类别信息和成语等。文章以频率统计和频率分布统计作为维汉机器翻译词典的词条收录原则,统计维吾尔文中常用的单词数目,论述维汉机器翻译词典的设计思想,用BNF形式语言和Jackson图描述维汉机器翻译词典应包含的词条信息,最后介绍词典的具体构造方法、词条排序原则、索引表和属性库的数据结构和词典信息的查找方法。试验表明该词典在解决维吾尔语词汇歧义、结构歧义、提高汉语译文准确率等方面较为有效。Electronic Dictionary is the largest component of a Machine Translation system in the terms of the information it holds.The quality and size of the electronic dictionary limits the scope and coverage of a Machine Translation system.What makes the MT dictionary different from the generic dictionary is that each word contained in MT dictionary should have corresponding information for part of speech,semantics and idioms in which this word occurs.This paper statistics the number of commonly used Uighur words using word frequency statistics and frequency distribution statistics,discusses the design principal,describes the structure of the word information contained in the MT dictionary using BNF formation and Jackson chart,finally introduces construction and data structure,word sorting method,structure of index table and attribute library and search method of an electronic dictionary for Uighur-Chinese MT system.Experimental evidence indicates that this lexicon has obvious efficiency in lexical disambiguation,syntactical disambiguation,and improvement of accuracy of target language translation.
分 类 号:TP391.2[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222