深度学习中文命名实体识别研究进展  被引量:5

Research Progress on Named Entity Recognition in Chinese Deep Learning

在线阅读下载全文

作  者:李莉 奚雪峰 盛胜利[4] 崔志明 徐家保 LI Li;XI Xuefeng;SHENG Shengli;CUI Zhiming;XU Jiabao(School of Electronic&Information Engineering,Suzhou University of Science and Technology,Suzhou,Jiangsu 215000,China;Suzhou Key Laboratory of Virtual Reality Intelligent Interaction and Application Technology,Suzhou,Jiangsu 215000,China;Suzhou Smart City Research Institute,Suzhou University of Science and Technology,Suzhou,Jiangsu 215000,China;Texas Institute of Technology,Lubbock,Texas 79401,USA)

机构地区:[1]苏州科技大学电子与信息工程学院,江苏苏州215000 [2]苏州市虚拟现实智能交互应用技术重点实验室,江苏苏州215000 [3]苏州科技大学智慧城市研究院,江苏苏州215000 [4]德州理工大学,美国德克萨斯州拉伯克市79401

出  处:《计算机工程与应用》2023年第24期46-69,共24页Computer Engineering and Applications

基  金:国家自然科学基金(61876217,62176175);江苏省“六大人才高峰”高层次人才项目(XYDXX-086);苏州市科技计划项目(SGC2021078)。

摘  要:中文命名实体识别(CNER)指识别中文文本中具有特定意义的实体,是自然语言处理诸多下游任务的重要基石。近年来,深度学习技术依托其端到端的方法,自动学习到更深层次和更抽象的数据特征,摆脱了人工标注的依赖,解决了高维特征空间的数据稀疏问题,从而逐渐成为中文命名实体识别方法的主流。回顾了命名实体识别的发展进程和CNER的特殊性和难点;围绕着中文命名实体识别的不同处理特点,将基于深度学习的中文命名实体识别的方法分类为扁平实体边界问题、中文嵌套命名实体识别和CNER小样本问题处理三个领域,并具体阐述这三类领域的模型、细分领域和最近的研究进展并整理了部分典型深度学习方法在相关数据集上的实验结果;再次总结了中文命名实体识别任务的常用数据集和评估方法;指出了当前中文命名实体识别技术面临的挑战和未来的研究方向。data features,thereby reducing the need for manual annotation and addressing the issue of data sparsity in high-dimensional feature spaces.As a result,deep learning has emerged as the dominant approach for Chinese named entity recognition.This article initially provides an overview of the historical development of named entity recognition and outlines the specific challenges and intricacies associated with Chinese named entity recognition(CNER).It then delves into the distinct processing characteristics of CNER and categorizes deep learning-based methods for CNER into three key areas:flat entity boundary problem,Chinese nested named entity recognition,and CNER small sample problem.The paper offers a detailed description of the models,subdivisions,and recent research progress in each of these areas,and presents experimental results of several noteworthy deep learning methods on relevant datasets.Finally,the article identifies the challenges and future research directions for CNER,and concludes with a summary of commonly used datasets and evaluation methods for Chinese named entity recognition.

关 键 词:中文命名实体识别 深度学习 实体边界 中文嵌套命名实体识别 低资源中文命名实体识别 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术] TP18[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象