检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:葛君伟[1] 李帅领 方义秋[1] Ge Junwei;Li Shuailing;Fang Yiqiu(College of Computer Science&Technology,Chongqing University of Posts&Telecommunications,Chongqing 400065,China)
机构地区:[1]重庆邮电大学计算机科学与技术学院,重庆400065
出 处:《计算机应用研究》2021年第9期2619-2623,共5页Application Research of Computers
基 金:国家自然科学基金面上项目(62072066)。
摘 要:针对中文关系抽取中分词时引起的边界切分出错而造成的歧义问题,以及出现实体对重叠不能提取出所涉及的多个关系问题,提出一种基于字词混合的联合抽取方法。首先,对于分词边界问题,嵌入层在词向量的基础上结合字向量,并且增加位置信息来保证字与字之间的正确顺序。其次,模型引入混合扩张卷积网络进行不同粒度、更远距离的特征提取。最后,采用分层标注方法,通过得到的主实体信息标记对应的关系和客实体,每个主实体可对应多个关系和客实体。与其他关系抽取方法在相同中文数据集上进行实验对比,实验结果表明,该方法的抽取效果最佳,并且也表现出更好的稳定性。Aiming at the problem of ambiguity caused by boundary segmentation errors caused by word segmentation in Chinese relation extraction,and the problem of multiple relations involved in the overlapping of entity pairs,this paper proposed a joint extraction method based on word mixing.Firstly,for the word segmentation boundary problem,the embedding layer combined word vectors on the basis of word vectors,and added position information to ensure the correct order between words.Se-condly,the model introduced a hybrid expanded convolutional network for feature extraction with different granularity and longer distance.Finally,it used the hierarchical labeling method to mark the corresponding relationship and object entity through the obtained main entity information,and each main entity could correspond to multiple relations and object entities.Compared with other relation extraction methods on the same Chinese data set,the experimental results show that the extraction effect of this method is the best and also shows better stability.
关 键 词:关系抽取 分词 字词混合 边界切分 混合扩张卷积
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.217.164.190