检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:刘阳光 岂凡超 刘知远[1,2,3] 孙茂松[1,2,3] LIU Yangguang;QI Fanchao;LIU Zhiyuan;SUN Maosong(Department of Computer Science and Technology,Tsinghua University,Beijing 100084,China;Institute for Artificial Intelligence,Tsinghua University,Beijing 100084,China;State Key Laboratory of Intelligent Technology and System,Tsinghua University,Beijing 100084,China)
机构地区:[1]清华大学计算机科学与技术系,北京100084 [2]清华大学人工智能研究院,北京100084 [3]清华大学智能技术与系统国家重点实验室,北京100084
出 处:《中文信息学报》2021年第4期23-34,共12页Journal of Chinese Information Processing
基 金:国家重点研发计划(2020AAA0106501)。
摘 要:义原(sememe)被定义为人类语言中不可再分的最小语义单位。一个词语的意义可以由多个义原的组合来表示。以往人们已经人工为词语标注义原并构建了知网(HowNet)这一语言知识库,并借此将义原应用到了多种自然语言处理任务。但传统的人工标注费时费力,而且不同的专家进行标注难免会引入标注者的主观偏差,导致标注的一致性和准确性难以保证。因此,保证词的义原标注一致性已成为建设高质量语言知识库HowNet、提升义原应用任务效果的首要任务。该文首次提出了一种对HowNet已标注的义原进行一致性检验的方法。实验结果表明,所提方法切实有效,能够很好地应用于HowNet知识库的标注一致性检验以及完善扩充。Sememes are defined as the minimum semantic units of human languages that cannot be subdivided.The meaning of a word can be defined by a combination of multiple sememes.Sememe-based linguistic knowledge bases(KBs),in which words are manually annotated with sememes,have been successfully constructed and utilized in many NLP tasks.However,the manual annotation of sememes is time-consuming and labor-intensive,and person bias will be inevitably introduced,which prejudices annotation consistency and accuracy.In this paper,we for the first time propose a method to conduct automatic consistency check of sememe annotations in HowNet.Experimental results demonstrate the effectiveness of out method,which show that our method can be applied to the annotation consistency check and extension of HowNet.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.46