多义词词典义项可区分度的度量  

Measuring Sense Distinguishability of Polysemous Words

在线阅读下载全文

作  者:柏晓鹏 Bai Xiaopeng

机构地区:[1]华东师范大学中文系 [2]华东师范大学语文教育研究中心,上海200241

出  处:《辞书研究》2020年第4期9-15,47,I0001,共9页Lexicographical Studies

基  金:华东师范大学语文教育研究基地2020年度研究项目“部编本小学教材韵律词的切分及其分布研究”(项目编号12901-412224-19095/006)资助。

摘  要:多义词词典义项的可区分度是指,人们根据词典提供的信息在语料中对多义词义项进行辨析的难度。文章探讨如何度量多义词可区分度。以往对这个问题的研究主要使用两种方法:基于义类体系的方法和基于机器学习的词义消歧方法。文章提出利用人工标注词典义项,然后对标注结果计算标注者一致性(inter-annotators agreement)的方法,从而计算多义词义项可区分度。基于对几种方法的讨论和对比,文章发现,通过计算人工标注结果一致性的方法较为有效、直观和省力。文章认为,“多义词词典义项可分区度”是利用人对多义词辨析的结果,对词典义项的评价,并不必然反映词典释义的好坏,它应该被视为一类参考数据,为词典编纂提供指示。The sense distinguishability of a polysemous word indicates how hard or easy it is for a person to identify the proper sense of the word in specific contexts based on its definitions in a dictionary.In this article,we attempt to measure the sense distinguishability of a polysemous word using two methods:one is the taxonomy method,and the other the word sense disambiguation method.We propose to label the senses of the word by hand and then measure the distinguishability based on the result of inter-annotator agreement.Although the sense distinguishability thus measured cannot be used to judge the quality of dictionary definition,it serves as a reference to the distinction between senses of a polysemous word.

关 键 词:多义词 义项可区分度 标注一致性 词义消歧 

分 类 号:H31[语言文字—英语]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象