基于语义树的中文词语相似度计算与分析  被引量:36

Chinese Word Similarity Computing Based on Semantic Tree

在线阅读下载全文

作  者:张亮[1,2] 尹存燕[1] 陈家骏[1] 

机构地区:[1]南京大学计算机软件新技术国家重点实验室,江苏南京210093 [2]江苏警官学院公安科技系,江苏南京210000

出  处:《中文信息学报》2010年第6期23-30,共8页Journal of Chinese Information Processing

基  金:国家863高技术发展研究计划资助项目(2006AA010109);国家自然科学基金资助项目(60673043)

摘  要:词语相似度的分析与计算是自然语言处理关键技术之一,对句法分析、机器翻译、信息检索等能提供很好的帮助。基于语义资源Hownet的中文词语相似度计算是近年来的研究热点,但大多数的研究都是对中国科学院计算技术研究所刘群提出的计算方法的改进和完善。该文充分分析和利用新版Hownet(2007)的概念架构和语义多维表达形式,从概念的主类义原、主类义原框架以及概念特性描述三个方面综合分析词语相似度,并在计算中区分语义特征相似度和句法特征相似度。实验结果理想,与人的直观判断基本一致。Word similarity analysis and computing is one of the key technologies in natural language processing.It can offer substantial help to parsing,machine translation and information retrieval etc.Recently Chinese word similarity computing based on Hownet has become a hot research issue,though most of which are improvements or modifications to what was proposed in(Liu,2002).Based on new Hownet(2007) with its concept frame and the multi-dimension semantic expression form,this paper proposes a new method to analyze and compute Chinese word similarity from three dimensions: the main sememe,the main sememe frame and the concept characteristic description.This method also distinguishes the semantic similarity and the syntax similarity in computation.Experiment shows that the method produces a good performance.

关 键 词:语义树 词语相似度 《知网》2007 语义距离 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象