基于LEBERT的时间信息增强中文命名实体识别  

Enhanced Chinese named entity recognition based on LEBERT time information

在线阅读下载全文

作  者:张光明[1] 肖然 张弛 高谦 谈栋华 彭菊红[1,3] ZHANG Guangming;XIAO Ran;ZHANG Chi;GAO Qian;TAN Donghua;PENG Juhong(School of Artificial Intelligence,Hubei University,Wuhan 430062,China;School of Computer and Information Engineering,Hubei University,Wuhan 430062,China;Key Laboratory of Intelligent Sensing System and Security(Hubei University),Ministry of Education,Wuhan 430062,China)

机构地区:[1]湖北大学人工智能学院,湖北武汉430062 [2]湖北大学计算机与信息工程学院,湖北武汉430062 [3]智能感知系统与安全教育部重点实验室(湖北大学),湖北武汉430062

出  处:《湖北大学学报(自然科学版)》2025年第1期118-125,共8页Journal of Hubei University:Natural Science

基  金:湖北省重点研发项目(2023BAB068)资助。

摘  要:为解决现有预训练模型没有充分考虑汉语词汇的分割特征的问题,提出一种基于LEBERT-ILRN-RA-CRF的中文命名实体识别模型。该模型首先利用LEBERT对输入文本进行词汇表增强和嵌入处理,然后利用ILRN模块提取时间信息,并将字符-词融合与字向量采集相结合,最后使用条件随机场(CRF)进行结果校正。此外,该模型还引入了词汇量增强和残差门控注意网络来加强时间特征的提取和局部特征的表达,进一步提升了模型的识别效果。在Weibo和Resume两个数据集上分别取得了71.73%和96.51%的宏F1值。实验表明该模型可以考虑到汉语词汇的分割问题,改善中文命名实体识别任务的识别效果。In order to solve the problem that the existing pre-trained models do not fully consider the segmentation features of Chinese words,a Chinese named entity recognition model based on LEBERT-ILRN-RA-CRF was proposed.The model firstly used LEBERT to enhance and embed the input text,then used ILRN module to extract time information,combined character-word fusion with word vector acquisition,and finally used conditional random field(CRF)to correct the result.In addition,the model also introduced vocabulary enhancement and residual gated attention network to strengthen the extraction of temporal features and the expression of local features,which further improved the recognition effect of the model.The macro F1 values of 71.73%and 96.51%were obtained on the Weibo and Resume datasets,respectively.Experiments show that the model can take into account the segmentation problem of Chinese vocabulary and improve the recognition effect of Chinese named entity recognition task.

关 键 词:中文命名实体识别 时间信息增强 LEBERT CRF 残差门控注意力机制 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象