检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]清华大学计算机科学与技术系智能技术与系统国家实验室,北京100084
出 处:《模式识别与人工智能》1998年第2期140-146,共7页Pattern Recognition and Artificial Intelligence
基 金:国家自然科学基金
摘 要:本文提出一种基于例子的基本名词短语的识别模型,并着重讨论了其中的词语相似度度量方法:首先根据词语在限定距离内的同现关系计算词语的关联度,然后利用关联词语和关联度建立词语的语境向量,并基于"相似语境中出现的词语相似"的假设,用词语出现的语境相似度来度量词语分布相似度.实验结果表明,这种基于分布的词语相似度度量方法是基于义类词典的相似度度量方法的重要补充.The paper puts forward an example-based baseNP recognition model and discussed the distribution-based word similarity metric. First word association ratios are computed depending on the word co-occurrence within a limited distance. Then the contextual vector of the word is constructed using the associated words and association ratios. Based on the assumption that the words occurring in the similar context are similar, the word similarity is approximated by the similarity between the contextual vectors. The experiment shows the distributional similarity is an important supplement to the sense category thesaurus.
分 类 号:TP391[自动化与计算机技术—计算机应用技术] TP18[自动化与计算机技术—计算机科学与技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.13