基于改进的Lesk算法的词义排歧算法  被引量:4

Word sense disambiguation using an adapted Lesk algorithm

在线阅读下载全文

作  者:王永生[1] 

机构地区:[1]同济大学出国培训学院,上海200092

出  处:《微型机与应用》2013年第24期69-71,75,共4页Microcomputer & Its Applications

基  金:教育部人文社会科学研究基金青年项目(07JC740009)

摘  要:英文中的一词多义现象非常普遍,这给英文的词义排歧带来了极大的困难。针对这种情况,提出了一种基于改进的Lesk算法的词义排歧算法,即以语义词典WordNet为基础,借助CBC算法扩充目标词的相似词集合,通过改进的Lesk算法进行词义排歧。算法以英文Senseval-2任务作为测试目标,通过对目标词的义项进行筛选,去除其中一些不常用的义项,实验结果表明,总体排歧正确率达到58.4%。In English , lexical ambiguity is pervasive , so English word sense disambiguation is one of the most difficult tasks in natural language processing . This paper presents an adaptation of Lesk algorithm based on WordNet . Additionally an algorithm called CBC is used to enlarge the amount of similar words of the target word . This method is evaluated using the Senseval-2 word sense disambiguation exercise , and attains an overall accuracy of 58 . 4%.

关 键 词:词义排歧 Lesk 算法 WORD NET 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象