基于潜在语义特性的语义双关语检测及双关词定位  被引量:2

Homographic Puns Detection and Puns Location Based on Latent Semantic Characteristics

在线阅读下载全文

作  者:刁宇峰 杨亮[1] 林鸿飞[1] 吴迪[1] 樊小超 徐博[1] 许侃[1] DIAO Yufeng;YANG Liang;LIN Hongfei;WU Di;FAN Xiaochao;XU Bo;XU Kan(Institute of Computer Science and Technology, Dalian University of Technology, Dalian, Liaoning 116024, China;College of Computer Science and Technology, Inner Mongolia University for Nationalities, Tongliao, Inner Mongolia 028043, China;College of Computer Science and Technology, Xinjiang Normal University, Urumqi, Xinjiang 830054, China)

机构地区:[1]大连理工大学计算机科学与技术学院,辽宁大连116024 [2]内蒙古民族大学计算机科学与技术学院,内蒙古通辽028043 [3]新疆师范大学计算机科学技术学院,新疆乌鲁木齐830054

出  处:《中文信息学报》2019年第4期12-19,28,共9页Journal of Chinese Information Processing

基  金:国家自然科学基金(61632011;61572102;61702080;61602079;61602078);中央高校基本科研业务费专项资金(DUT18ZD102);中国博士后科学基金(2018M631788)

摘  要:语义双关语是幽默、笑话和喜剧等作品的来源之一,在人类写作的发展进程中具有重要的历史地位。由于语义双关语存在歧义难懂的特点,因此难以挖掘语义双关语的潜在语义信息,故目前语义双关语的检测和双关词的定位是自然语言处理任务中的一项困难和挑战。该文在语义双关语的理论基础上,挖掘了一系列的潜在语义特性,并构建了对应每个特性的特征集,用以检测语义双关语;同时从潜在语义特性出发,提出了一种基于词向量和同义词融合的语义相似度匹配算法实现语义双关词的定位。在SemEval 2017Task 7和Pun of the Day数据集上均取得了较好的实验结果,验证了该文所提出的检测算法和定位算法。Homographic pun,as a common source of humor in jokes and other comedic word,is hard to detect and locate the homographic pun words.We design a series of latent semantic characteristics and corresponding features to detect homographic puns.Then,a semantic similarity matching algorithm is proposed to locate pun words based on the fusion of Word Embedding and Sysnet.Experiment results on SemEval 2017 Task 7 and Pun of the Day demonstrate the effectiveness of the proposed method.

关 键 词:语义双关句 潜在语义特性 双关词定位 词向量 同义词 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象