检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]哈尔滨工业大学计算机学院,黑龙江哈尔滨 150001
出 处:《哈尔滨工程大学学报》2006年第B07期575-579,共5页Journal of Harbin Engineering University
基 金:国家自然科学基金资助项目(60375019).
摘 要:在利用大规模英汉双语平行语料库进行双向双语翻译词典建设时发现:由于错误累计问题.现有词对齐技术无法直接获取质量较高的双语词汇知识.由此提出一种基于HowNet以及WordNet进行相似度计算,然后设定相似度阈值来进行词义过滤的方法.实验结果表明该方法行之有效.并对HowNet以及WordNet相似度计算方法进行了基于实际应用的对比与探讨后得出:HowNet在语义区分上粒度更细因此其召回率较高,WordNet则具有更高的精确率.While using a large-scale bilingual English-Chinese corpus to build translation dictionary, after some statistics and analysis, it is found that there are some unconquerable error accumulation problems while acquiring bilingual lexical knowledge by using large-scale bilingual corpus. Furthermore, a method is raised to solve this problem using semantic dictionary and its similarity measurement, Primary experiment has indicated that this method is effective and feasible. The application-oriented comparison between HowNet and WordNet has been made in this paper, and a conclusion is drawn: HowNet has higher recall while WordNet has higher precision for their difference of semantic granularity.
关 键 词:词对齐 知识获取 HOWNET WORDNET 相似度 语义词典 错误累计
分 类 号:TP182[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.112