检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:柏晓鹏 Bai Xiaopeng
机构地区:[1]华东师范大学中文系 [2]华东师范大学语文教育研究中心,上海200241
出 处:《辞书研究》2020年第4期9-15,47,I0001,共9页Lexicographical Studies
基 金:华东师范大学语文教育研究基地2020年度研究项目“部编本小学教材韵律词的切分及其分布研究”(项目编号12901-412224-19095/006)资助。
摘 要:多义词词典义项的可区分度是指,人们根据词典提供的信息在语料中对多义词义项进行辨析的难度。文章探讨如何度量多义词可区分度。以往对这个问题的研究主要使用两种方法:基于义类体系的方法和基于机器学习的词义消歧方法。文章提出利用人工标注词典义项,然后对标注结果计算标注者一致性(inter-annotators agreement)的方法,从而计算多义词义项可区分度。基于对几种方法的讨论和对比,文章发现,通过计算人工标注结果一致性的方法较为有效、直观和省力。文章认为,“多义词词典义项可分区度”是利用人对多义词辨析的结果,对词典义项的评价,并不必然反映词典释义的好坏,它应该被视为一类参考数据,为词典编纂提供指示。The sense distinguishability of a polysemous word indicates how hard or easy it is for a person to identify the proper sense of the word in specific contexts based on its definitions in a dictionary.In this article,we attempt to measure the sense distinguishability of a polysemous word using two methods:one is the taxonomy method,and the other the word sense disambiguation method.We propose to label the senses of the word by hand and then measure the distinguishability based on the result of inter-annotator agreement.Although the sense distinguishability thus measured cannot be used to judge the quality of dictionary definition,it serves as a reference to the distinction between senses of a polysemous word.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.21.33.186