检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:王超 吕国英[1] 李茹[1,2] 柴清华[3] 李晋荣 WANG Chao;LYU Guoying;LI Ru;CHAI Qinghua;LI Jinrong(School of Computer Science and Technology,Shanxi University,Taiyuan,Shanxi 030006,China;Key Laboratory of Computation Intelligence and Chinese Information Processing of Ministry of Education,Shanxi University,Taiyuan,Shanxi 030006,China;School of Foreign Language,Shanxi University,Taiyuan,Shanxi 030006,China)
机构地区:[1]山西大学计算机与信息技术学院,山西太原030006 [2]山西大学计算智能与中文信息处理教育部重点实验室,山西太原030006 [3]山西大学外国语学院,山西太原030006
出 处:《中文信息学报》2024年第2期25-35,共11页Journal of Chinese Information Processing
基 金:国家社会科学基金(18BYY009);山西省“四个一批”科技兴医创新计划项目(2022XM01)。
摘 要:汉语框架语义角色标注对汉语框架语义分析具有重要作用。目前汉语框架语义角色标注任务主要针对动词框架,但是汉语没有丰富的形态变化,很多语法意义都是通过虚词来表现的,其中副词研究是现代汉语虚词研究的重要部分,因此该文从副词角度出发构建了汉语副词框架及数据集,且对框架下的词元按照语义强弱进行了等级划分。目前的语义角色标注模型大多基于BiLSTM网络模型,该模型虽然可以很好地获取全局信息,但容易忽略句子局部特征,且无法并行训练。针对上述问题,该文提出了基于BERT特征融合与膨胀卷积的语义角色标注模型,该模型包括四层:BERT层用于表达句子的丰富语义信息,Attention层对BERT获取的每一层信息进行动态权重融合,膨胀卷积(IDCNN)层进行特征提取,CRF层修正预测标签。该模型在三个副词框架数据集上表现良好,F1值均达到了82%以上。此外,将该模型应用于CFN数据集上,F1值达到88.29%,较基线模型提升了4%以上。Chinese frame semantic role labeling plays an important role in Chinese frame semantic analysis.At present,the task of semantic role labeling in Chinese frame is mainly aimed at verb frame.This paper constructs a Chinese adverb framework and dataset,and classifies the word in the framework according to its semantic strength.Then,this paper proposes a semantic role labeling model based on Bert feature fusion and expansion convolution.The model includes four layers,with the bert layer to reperesent the rich semantic information of sentences,the attention layer to dynamical weighs the information from each BERT layer,the expansion convolution(IDCNN)layer to extract features,and the CRF layer to predict tags.The model performs well in three adverb frame datasets,achieveing 82%or more F 1 value.In addition,the model achieves 88.29%F 1 value in CFN dataset,which is 4%above the baseline model.
关 键 词:汉语框架语义角色标注 副词 BERT 膨胀卷积 CRF
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.214