利用语义相似度解决双语词汇知识获取的错误累计问题  被引量:1

Resolving error accumulation of automatically acquiring bilingual lexical knowledge by semantic similarity

在线阅读下载全文

作  者:刘鹏远[1] 赵铁军[1] 李生[1] 杨沭昀 

机构地区:[1]哈尔滨工业大学计算机学院,黑龙江哈尔滨 150001

出  处:《哈尔滨工程大学学报》2006年第B07期575-579,共5页Journal of Harbin Engineering University

基  金:国家自然科学基金资助项目(60375019).

摘  要:在利用大规模英汉双语平行语料库进行双向双语翻译词典建设时发现:由于错误累计问题.现有词对齐技术无法直接获取质量较高的双语词汇知识.由此提出一种基于HowNet以及WordNet进行相似度计算,然后设定相似度阈值来进行词义过滤的方法.实验结果表明该方法行之有效.并对HowNet以及WordNet相似度计算方法进行了基于实际应用的对比与探讨后得出:HowNet在语义区分上粒度更细因此其召回率较高,WordNet则具有更高的精确率.While using a large-scale bilingual English-Chinese corpus to build translation dictionary, after some statistics and analysis, it is found that there are some unconquerable error accumulation problems while acquiring bilingual lexical knowledge by using large-scale bilingual corpus. Furthermore, a method is raised to solve this problem using semantic dictionary and its similarity measurement, Primary experiment has indicated that this method is effective and feasible. The application-oriented comparison between HowNet and WordNet has been made in this paper, and a conclusion is drawn: HowNet has higher recall while WordNet has higher precision for their difference of semantic granularity.

关 键 词:词对齐 知识获取 HOWNET WORDNET 相似度 语义词典 错误累计 

分 类 号:TP182[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象