检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]南京大学计算机软件新技术国家重点实验室,江苏南京210093 [2]江苏警官学院公安科技系,江苏南京210000
出 处:《中文信息学报》2010年第6期23-30,共8页Journal of Chinese Information Processing
基 金:国家863高技术发展研究计划资助项目(2006AA010109);国家自然科学基金资助项目(60673043)
摘 要:词语相似度的分析与计算是自然语言处理关键技术之一,对句法分析、机器翻译、信息检索等能提供很好的帮助。基于语义资源Hownet的中文词语相似度计算是近年来的研究热点,但大多数的研究都是对中国科学院计算技术研究所刘群提出的计算方法的改进和完善。该文充分分析和利用新版Hownet(2007)的概念架构和语义多维表达形式,从概念的主类义原、主类义原框架以及概念特性描述三个方面综合分析词语相似度,并在计算中区分语义特征相似度和句法特征相似度。实验结果理想,与人的直观判断基本一致。Word similarity analysis and computing is one of the key technologies in natural language processing.It can offer substantial help to parsing,machine translation and information retrieval etc.Recently Chinese word similarity computing based on Hownet has become a hot research issue,though most of which are improvements or modifications to what was proposed in(Liu,2002).Based on new Hownet(2007) with its concept frame and the multi-dimension semantic expression form,this paper proposes a new method to analyze and compute Chinese word similarity from three dimensions: the main sememe,the main sememe frame and the concept characteristic description.This method also distinguishes the semantic similarity and the syntax similarity in computation.Experiment shows that the method produces a good performance.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.69