检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:张东娜[1] 周春光[1] 刘彦斌[1] 郭东伟[1]
机构地区:[1]吉林大学计算机科学与技术学院,长春130012
出 处:《吉林大学学报(理学版)》2010年第5期811-816,共6页Journal of Jilin University:Science Edition
基 金:国家自然科学基金(批准号:60673099;60873146);国家高技术研究发展计划863项目基金(批准号:2009AA02Z307);吉林大学研究生创新基金(批准号:20091022)
摘 要:提出一种新的基于WordNet和文本集语义参数IC的计算方法,通过综合考虑概念在WordNet中语义信息以及数据集中的概率信息,即概念的自信息,同时利用新的参数考虑概念对在WordNet中的共享信息,设计了一种通用的概念语义相似性计算方法,该方法简化了传统语义相似性算法,并解决了语义相似性计算领域的相关问题,可以应用在信息抽取、信息检索、文档分类及本体学习中.领域通用的数据集R&B数据实验结果表明,该方法在计算语义相似度问题上有效。We first proposed a new method calculating semantic similarity parameter information content.The new algorithm is based on the concept semantic information in the knowledge base called WordNet and the probability in the corpus called self-information.Then,considering the existing algorithms are all domainrelated and the calculating processes are complicated,we proposed a universal method based on corpus statistics and WordNet calculating semantic similarity which can be used in information extraction,information retrieval,document clustering and ontology learning.The proposed method makes a substantial improvement experimenting on the benchmark data set-RB concept pairs.
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.3