检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:刘洪超[1] 黄居仁[1] 侯仁魁 李洪政[3] LIU Hongehao;HUANG Churen;HOU Renkui;LI Hongzheng(CBS, The Hong Kong Polytechnic University, Hong Kong, China;School of Chinese I.anguage and Literature, Ludong University, Yantai, Shandong 264001, China;Institute of Chinese Information Processing, Beijing Normal University, Beijing, 100875, China)
机构地区:[1]香港理工大学中文及双语学系 [2]鲁东大学文学院,山东烟台264001 [3]北京师范大学中文信息处理研究所,北京100875
出 处:《中文信息学报》2018年第1期26-33,共8页Journal of Chinese Information Processing
基 金:国家社会科学基金(16BYY110)
摘 要:该文主要介绍汉语动词事件类型的预测。事件类型是根据内部时间结构对汉语动词进行的重要分类,包括状态、活动、变化(完结和达成)。对汉语动词事件类型进行预测从理论上能够对以往语言学研究提出的特征进行验证,从应用上可以服务于机器翻译等任务。该文基于两种方式构建词向量进行汉语动词事件类型的预测,一种是根据语言学特征有监督地构建词向量,另一种是利用word2vec无监督地构建词嵌入向量。通过多元逻辑回归、支持向量机和人工神经网络分类器对汉语动词事件类型进行预测,最终实现了73.6%的总体准确率。This paper investigates the prediction of event types of Mandarin verbs,which are trisected into state,activity and transition or quartered into state,activity,accomplishment and achievement.Previous linguistic studies of event types of Mandarin verbs have come up with various features for different event types,but none of them are validated by statistical or computational methods.Both supervised vectors and unsupervised vectors are examined for prediction,i.e.the linguistics features and the embedding vectors by word2vec,respectively.We achieve an overall accuracy of 73.6% using classifiers of multinominal regression,supporting vector machine and the neural network.
关 键 词:事件类型 汉语动词 语言学特征 词嵌入 分类 预测
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.147