基于特征词关联性的同义词集挖掘算法  被引量:10

Chinese synset detection based on correlation among feature-words

在线阅读下载全文

作  者:陈建超[1] 郑启伦[1] 李庆阳[1] 严桂夺[1] 

机构地区:[1]华南理工大学计算机科学与工程学院,广州510640

出  处:《计算机应用研究》2009年第7期2517-2519,2532,共4页Application Research of Computers

基  金:广东省自然科学基金资助项目(07006474);广东省科技攻关资助项目(2007B010200044)

摘  要:一词多义和多词同义是语言中广泛存在的现象,它给自然语言处理带来了很多困难,解决这个难题的有效办法是建立包含上下文信息的同义词集。深入分析了概念、词汇和特征词三者的内在关系,并在此基础上提出了一种基于同义词汇的特征词的关联性,从文本中挖掘同义词集的算法。根据特征词之间存在关联性的特点,算法以成熟的关联规则挖掘算法作为基础,获得了明显优于同类算法的实验效果。算法获得的同义词集附带上下文信息,可有效解决文本中词汇的多义性和同义性问题。The paper analysed deeply the inherent relationship among concept, word and feature-words of both, and then proposed a novel synsets mining algorithm based on the correlation among the feature-words of the words in a synset. The implement of the algorithm was based on the mature association rule mining algorithm, and obtained state-of-the-art performance. Obtained synsets by the algorithm including context information, so they can help solve the problem by synonyms and homonyms in texts.

关 键 词:自然语言处理 同义词集 特征词 概念 

分 类 号:TP301[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象