检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:柏晓鹏 BAI Xiaopeng
机构地区:[1]华东师范大学中文系,上海200241 [2]华东师范大学语文教育研究基地
出 处:《语言学论丛》2020年第1期116-134,共19页Essays on Linguistics
基 金:“中央高校基本科研业务费项目华东师范大学跨学科工作坊项目(项目号:2017ECNU-KXK010)”;“华东师范大学教育学高峰学科建设项目”资助。
摘 要:本文从语料库词义标注的角度,结合词义自动消歧实验,说明词义义类标注的必要性和可行性.与词语义项相比,义类不仅仅是义项的抽象表示,它是具体词不相关的全局性词义信息,在语料库中保持意义不变,标注了义类的语料库为基于词义信息的统计提供了物质基础.我们使用基于词汇组合特征的词义分类方法,建立了"现代汉语词义分类体系",并对一个百万词规模的语料库进行了义类标注.我们使用有监督的自动分类方法,在这个义类语料库上进行了词义消歧实验并取得很好的结果.说明了我们使用的词义分类体系是一个适用于语料库标注的义类标记集.In this article,we discussed the issue of necessity and feasibility of adding lexical class tag to words in corpus,in terms of corpus annotation and word sense disambiguation(WSD).Compared to word sense annotation using dictionary definition,lexical class is not just a"coarse"version of word sense.It is global lexical information independent from specific word,and the meaning maintains constant across corpus.To justify these notions,we created a set of lexical class tags,called"Mandarin Lexical Taxonomy",and annotated a millionword size corpus with these tags.Then we did WSD experiments using supervised machine learning methods.The results served the purpose of our work properly:with its semantic consistency,lexical class alleviated the"over-fine"problem of corpus annotation with word sense and achieved a desirable WSD outcome.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.3