检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:张辰麟 王明文[1] 谭亦鸣 肖文艳[1] ZHANG Chenlin;WANG Mingwen;TAN Yiming;XIAO Wenyan(School of Computer and Information Engineering,Jiangxi Normal University,Nanchang,Jiangxi 330022,China;School of Cyberspace Security,Southeast University,Nanjing,Jiangsu 211189,China)
机构地区:[1]江西师范大学计算机信息工程学院,江西南昌330022 [2]东南大学网络空间安全学院,江苏南京211189
出 处:《中文信息学报》2020年第8期32-40,共9页Journal of Chinese Information Processing
基 金:国家自然科学基金(61876074)。
摘 要:委婉语是语言交流中不可或缺的交际手段,委婉语研究一直是语言学界的热门话题之一,但在自然语言处理领域,尚未有委婉语相关研究。该文借助现有纸质词典,基于语料库检索和专家人工判别的方式,初步构建了规模为63000余条语料的汉语委婉语语言资源;并根据自然语言处理的相关任务需求,结合词典释义对委婉语进行分类。该文提出了利用同类委婉语的上下文语境辅助进行标注的方法。经过实验,对简单语义委婉语的语义判别准确率达89.71%,对语义复杂的兼类委婉语的语义判别准确率达74.65%,初步验证了利用计算机辅助人工标注构建委婉语语言资源的可行性。Euphemism is an indispensable method of language communication.It has always been one of the hottest issue in linguistics.However,this issues is hardly addressed in natural language processing community.In this paper,a corpus of euphemism(about 63,000 sentences)is collected and identified manually,with a reference to existing dictionaries.According to the dictionaries’definition and the requirements of the related natural language processing work,euphemisms are classified at the semantic level.With the collected corpus and classification,we attempted to identify polysemous euphemisms automatically and achieved an accuracy of 89.71%for simple euphemisms and 74.65%for complex ones.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:13.59.111.209