检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:王淑媛[1] 田生伟[1] 禹龙[2] 冯冠军[3] 艾山.吾买尔[4] 李圃[5] 赵建国[3] WANG Shuyuan1 ,TIAN Shengwei1,YU Long 2,FENG Guanjun 3,AISHAN Wumaier4,LI Pu 5,ZHAO Jianguo3(1.School of Software; 2.Net Center; 3.College of Humanities; 4.College of Information Science and Engineering; 5.School of Languages; Xinjing University,Urumqi 830046,Chin)
机构地区:[1]新疆大学软件学院,乌鲁木齐830046 [2]新疆大学网络中心,乌鲁木齐830046 [3]新疆大学人文学院,乌鲁木齐830046 [4]新疆大学信息科学与工程学院,乌鲁木齐830046 [5]新疆大学语言学院,乌鲁木齐830046
出 处:《计算机工程》2018年第6期305-310,共6页Computer Engineering
基 金:国家自然科学基金(61662074;61563051;61262064);国家自然科学基金重点项目(61331011);新疆自治区科技人才培养项目(QN2016YX0051)
摘 要:结合维吾尔语的语言特点,基于堆栈降噪自编码(SDAE),提出一种新的维吾尔语事件共指关系识别方法。将维吾尔语事件两两构成候选事件对,抽取事件基本属性、触发词、事件距离等9项特征,利用Word Embedding富含语义信息的特性,将其计算得到的维吾尔语事件触发词语义相似度作为特征之一,训练SDAE模型,将SDAE的输出作为softmax层的输入,从而分类完成维吾尔语事件共指关系识别任务。实验结果表明,与浅层机器学习模型支持向量机相比,基于深度学习机制的SDAE模型更适用于维吾尔语事件共指关系识别任务,并提升了识别性能。Based on the characteristics of Uyghur language,a method of identifying Uyghur language event coreference relationship based on Stacked Denoising Autoencoder(SDAE) is proposed.This paper divides the Uyghur events to the candidate event pairs,extracted the nine features,basic characteristics of the event,the trigger word and the event distance.At the same time,the word embedding is used to calculate the semantic similarity of Uyghur events trigger words,taking semantic similarity as one of the features.And then training SDAE model,using softmax to complete the identification task of Uyghur language event coreference relationship.Experimental results show that SDAE is more suitable for the identification task than Support Vector Machine(SVM),the shallow machine learning model,and the use of word embedding further enhances the identification performance.
关 键 词:共指关系 维吾尔语 语义相似度 堆栈降噪自编码 深度学习
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.38