结合全局对应矩阵和相对位置信息的古汉语实体关系联合抽取  

Joint Extraction of Ancient Chinese Entity Relations by Combining Global Correspondence Matrix and Relative Position Information

在线阅读下载全文

作  者:胡益裕 左家莉[1] 涂传龙 曾雪强[1] 万中英[1] 王明文[1,2] HU Yiyu;ZUO Jiali;TU Chuanlong;ZENG Xueqiang;WAN Zhongying;WANG Mingwen(School of Computer and Information Engineering,Jiangxi Normal University,Nanchang,Jiangxi 330022,China;School of Digital Industry,Jiangxi Normal University,Shangrao,Jiangxi 334000,China;School of Computer Science and Engineering,Guangzhou Institute of Science and Technology,Guangzhou 510540,China)

机构地区:[1]江西师范大学计算机信息工程学院,江西南昌330022 [2]江西师范大学数字产业学院,江西上饶334000 [3]广州理工学院计算机科学与工程学院,广东广州510540

出  处:《中文信息学报》2024年第11期35-45,共11页Journal of Chinese Information Processing

基  金:国家自然科学基金(62466027,61866018,62266023,62266021);江西省教育厅科学技术研究项目(GJJ2200330)。

摘  要:目前,基于全局对应矩阵的联合抽取模型在英文领域和现代汉语领域的实体关系抽取任务上取得了SOTA(state-of-the-art)结果,然而在古汉语实体关系抽取任务上表现相对较差。这首先由于当前的古汉语实体关系数据集具有数据规模小、数据标注稀疏的特点,模型无法从数据中学习到足量的信息;其次是因为该模型训练时缺少实体的跨度信息,使得模型容易生成长度异常的实体。针对上述问题,该文在研究了开源的《资治通鉴》语料后,人工构建了一个古汉语实体关系数据集,并设计了一种结合全局对应矩阵和相对位置信息的实体关系联合抽取方法。该方法在古汉语实体关系数据集上的精确率和F1值分别达到了81.0%和67.0%,相较于基线模型提升了6.8%和1.4%。同时,该文通过实验验证了上述融合相对位置信息的方法对于解决“容易生成长度异常实体”问题的有效性。The joint extraction model based on the global correspondence matrix has achieved SOTA(state-of-the-art)results in English and modern Chinese,but performs relatively poor in ancient Chinese.To deal with the limited ancient Chinese entity relation data set and alleviate the generated entities with abnormal length,this paper constructs an ancient Chinese entity relation data set,and designs a joint entity relation extraction method combining global correspondence matrix and relative location information.Experiments show that the proposed achieves 81.0%accuracy and 67.0%F1 values,out-performing the baseline by 6.8%and 1.4%,respectively.

关 键 词:古汉语数据集构建 实体关系联合抽取 全局对应矩阵 相对位置信息 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象