共现关键词—叙词同义关系自动识别研究——基于互信息法、概率法的对比分析  被引量:9

Automatic Recognition of Synonymous About Keyword-Descriptor Co-occurrence——Based on Comparative Analysis Between Mutual Information Method and Probability Method

在线阅读下载全文

作  者:钟伟金[1] 

机构地区:[1]广东医学院图书馆,湛江520423

出  处:《图书情报工作》2012年第18期122-126,共5页Library and Information Service

基  金:教育部人文社会科学研究一般项目“共现词汇语义关系挖掘与本体自动构建研究”(项目编号:10YJC870051);广东高校优秀青年创新人才培育项目“基于词共现的关键词语关系自动识别研究”(项目编号:wym09089)研究成果之一

摘  要:以科技文献中的共现关键词—叙词词对(以下简称共现词对)为研究对象,运用互信息法、概率法计算方法,以准确率和召回率为衡量指标,通过绝对值方式和相对最高值方式,分析这两种统计方法在不同区间内对同义共现词对的自动识别效果及特点。研究发现,概率法的相对最高值方式具有最佳的同义共现词对识别效果。最后,探讨互信息法、概率法与共现频率的关系,揭示这两种统计方法在同义共现词对的识别上存在互补的特性。Mutual information and probability method, which statistic results classified into absolute value and relative maximum value, will he used to makes a comparative analysis of the automatic recognition of synonymous on co-occurrence keywords and descriptor.Taking the precision and recall rate as measurement index, the relative maximum value of probability method can get a better synonymous recognition performance in the co occurrence keywords and descriptor. At last, the paper discovers complementary functions in the mutual information and the probability method by investigated the relation of the frequency of the co-occurrence between keywords and descriptor and the two statistic method.

关 键 词:同义词识别 互信息法 概率法 共现词 

分 类 号:G353[文化科学—情报学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象