检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]清华大学自动化系,北京100084
出 处:《中文信息学报》2000年第5期1-7,15,共8页Journal of Chinese Information Processing
摘 要:本文针对英汉机器翻译系统 (ECMT)中的语义排歧问题 ,提出了一种根据单词与语境之间的关系以消除单词语义歧义的模型。该模型利用反映单词之间语义共现关系的知识库词典 ,对有歧义的单词作出排歧。为提高知识库的覆盖率 ,本模型在对大量语料进行分析的基础上建立起单词语义分类之间的相关程度矩阵 ,同时采用动态链表来表示和维护语境 ,给出了寻找歧义单词的最可能的语义的排歧算法。开放测试的实验结果表明本方法使语义排歧的正确率提高约 1 0 %。This paper proposes a word sense disambiguating model,which is based on the word's semantic context.The model utilizes the knowledge dictionary that reflects the semantic concurrence information of English words.And the correlation of word semantic marks is obtained through statistical analysis of large real corpus.By evaluating each possible semantic context word,the most reasonable sense of the sense ambiguous word is selected.The experiment of this method proves an increase of 10% in precision.
关 键 词:自然语言处理 语义排歧 机器翻译 语境 ECMT
分 类 号:TP391.2[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.145