汉语委婉语语言资源建设  被引量:1

Construction of Chinese Euphemism Resources

在线阅读下载全文

作  者:张辰麟 王明文[1] 谭亦鸣 肖文艳[1] ZHANG Chenlin;WANG Mingwen;TAN Yiming;XIAO Wenyan(School of Computer and Information Engineering,Jiangxi Normal University,Nanchang,Jiangxi 330022,China;School of Cyberspace Security,Southeast University,Nanjing,Jiangsu 211189,China)

机构地区:[1]江西师范大学计算机信息工程学院,江西南昌330022 [2]东南大学网络空间安全学院,江苏南京211189

出  处:《中文信息学报》2020年第8期32-40,共9页Journal of Chinese Information Processing

基  金:国家自然科学基金(61876074)。

摘  要:委婉语是语言交流中不可或缺的交际手段,委婉语研究一直是语言学界的热门话题之一,但在自然语言处理领域,尚未有委婉语相关研究。该文借助现有纸质词典,基于语料库检索和专家人工判别的方式,初步构建了规模为63000余条语料的汉语委婉语语言资源;并根据自然语言处理的相关任务需求,结合词典释义对委婉语进行分类。该文提出了利用同类委婉语的上下文语境辅助进行标注的方法。经过实验,对简单语义委婉语的语义判别准确率达89.71%,对语义复杂的兼类委婉语的语义判别准确率达74.65%,初步验证了利用计算机辅助人工标注构建委婉语语言资源的可行性。Euphemism is an indispensable method of language communication.It has always been one of the hottest issue in linguistics.However,this issues is hardly addressed in natural language processing community.In this paper,a corpus of euphemism(about 63,000 sentences)is collected and identified manually,with a reference to existing dictionaries.According to the dictionaries’definition and the requirements of the related natural language processing work,euphemisms are classified at the semantic level.With the collected corpus and classification,we attempted to identify polysemous euphemisms automatically and achieved an accuracy of 89.71%for simple euphemisms and 74.65%for complex ones.

关 键 词:委婉语 语义辨析 语言资源构建 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象