基于词林的词语相似度的度量  被引量:15

A Method for Measuring Word Similarity Based on Cilin

在线阅读下载全文

作  者:吕立辉[1] 梁维薇[1] 冉蜀阳[1] 

机构地区:[1]四川大学

出  处:《现代计算机》2013年第1期3-6,9,共5页Modern Computer

摘  要:词语相似度的计算是人工智能领域的一个基础性的研究课题,它在自然语言处理,QA平台的搭建、语义消歧、文本的聚类和分类这些问题有着很广泛的应用。提出一种基于同义词词林的中文单词相似度计算方法,通过两个单词在词林树中相距的路径长,以及所在分支词义密度来计算两个中文单词间的相似度,并通过观察计算相似性的结果和人主观感觉的相似性的结果的皮尔逊线性相关系数来评价该方法。Words similarity measurement is a basic research topic in the fields of artificial intelligence. It has wild range of application in nature language processing, QA platform building, word sense disambiguation, document clustering, document classification. Proposes a method which could calculate the words similarity based on the path length between the words and the local sematic density of them in TongyiciaCilin. Evaluates the effectiveness of our method through the Pearson correlation coefficient of the subjective evaluation and the results of calculating the similarity.

关 键 词:相似度计算 同义词词林 皮尔逊线性相关系数 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象