检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
出 处:《计算机工程与科学》2017年第5期971-977,共7页Computer Engineering & Science
基 金:国家自然科学基金(61272353;61370128;61428201);教育部新世纪人才计划(NCET-13-0659);北京高校青年英才计划(YETP0583)
摘 要:语义相似度的计算是自然语言处理中的重要研究内容,在过去几十年的研究工作中,已有大量的语义相似度计算方法被提出并广泛应用于语义消歧、文本聚类等领域中。基于WordNet本体,改进了信息量IC计算模型,进而提出了两种混合式的语义相似度的计算方法。实验结果表明,由于同时考虑了概念节点在WordNet中的最短路径距离和IC语义距离,所提方法优于已有方法,其计算结果更加接近人类的主观判断。Calculation of semantic similarity is an important research content of natural language pro- cessing (NLP), and many measurements have been proposed for the past few decades. These measure- ments have been widely used in word sense disambiguation, text clustering and other research fields. We propose a new measurement to calculate information content (IC) with WordNet ontology, and then propose two new hybrid measurements to calculate semantic similarity. Experimental results show that the proposed method is better than the existing methods for considering both the shortest path distance and the IC semantic distance simultaneously , and the results are more close to human judgment.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.249