面向工艺文本的命名实体识别方法研究  被引量:8

Named Entity Recognition for Process Text

在线阅读下载全文

作  者:贾猛 王裴岩[1] 张桂平[1] 蔡东风[1] JIA Meng;WANG Peiyan;ZHANG Guiping;CAI Dongfeng(Human-Computer Intelligence Research Center,Shenyang Aerospace University,Shenyang,Liaoning 110136,China)

机构地区:[1]沈阳航空航天大学人机智能研究中心,辽宁沈阳110136

出  处:《中文信息学报》2022年第3期54-63,共10页Journal of Chinese Information Processing

基  金:辽宁省重点研发计划(2019JH2/10100020);辽宁省自然科学基金(20170540705);沈阳市重大科技创新研发计划(Y19-1-011)。

摘  要:面向工艺文本中的命名实体,该文提出一种融入领域知识的神经网络命名实体识别方法,旨在对零件、工程图纸、参考标准、属性等12类命名实体进行识别。该方法针对工艺实体的特点,利用领域词典及规则预识别出部分实体,形成预识别实体特征,将预识别实体特征加入CNN-BiLSTM-CRF神经网络模型,指导训练与预测。实验结果表明,该方法在工艺文本中能较好地完成命名实体识别任务,在提高词典及规则覆盖的实体识别效果的同时,还能够提高其他类实体的识别效果,通过加入预识别实体特征,使得F_(1)值从90.99%提升到93.03%,验证了该文方法的有效性。This paper proposes,a method of identifying named entities based on neural network with domain knowledge to identify 12 types of process entities including parts,engineering drawings,reference standards and attributes.According to the characteristics of process entities,this method uses domain dictionaries and rules to pre-identify candidate entities to form pre-recognition features,which are then fed to the CNN-BiLSTM-CRF neural network model.The experimental results show that,by adding pre-recognition entity features,the F1 value is increased from 90.99%to 93.03%.

关 键 词:工艺文本 命名实体识别 领域词典及规则 CNN-BiLSTM-CRF 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象