基于例子的基本名词短语识别中词语分布相似度的研究  被引量:1

A RESEARCH ON DISTRIBUTIONAL WORD SIMILARITY USED FOR EXAMPLE-BASE BASENP RECOGNITION

在线阅读下载全文

作  者:赵军[1] 黄昌宁[1] 

机构地区:[1]清华大学计算机科学与技术系智能技术与系统国家实验室,北京100084

出  处:《模式识别与人工智能》1998年第2期140-146,共7页Pattern Recognition and Artificial Intelligence

基  金:国家自然科学基金

摘  要:本文提出一种基于例子的基本名词短语的识别模型,并着重讨论了其中的词语相似度度量方法:首先根据词语在限定距离内的同现关系计算词语的关联度,然后利用关联词语和关联度建立词语的语境向量,并基于"相似语境中出现的词语相似"的假设,用词语出现的语境相似度来度量词语分布相似度.实验结果表明,这种基于分布的词语相似度度量方法是基于义类词典的相似度度量方法的重要补充.The paper puts forward an example-based baseNP recognition model and discussed the distribution-based word similarity metric. First word association ratios are computed depending on the word co-occurrence within a limited distance. Then the contextual vector of the word is constructed using the associated words and association ratios. Based on the assumption that the words occurring in the similar context are similar, the word similarity is approximated by the similarity between the contextual vectors. The experiment shows the distributional similarity is an important supplement to the sense category thesaurus.

关 键 词:自然语言处理 名词短语识别 词语分布相似度 

分 类 号:TP391[自动化与计算机技术—计算机应用技术] TP18[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象