面向汉语历史事件元素识别的深度学习模型构建及实现  被引量:5

Construction and Implementation of Deep Learning Model for Chinese Historical Event Element Recognition

在线阅读下载全文

作  者:王昊[1,2] 王雪颖 孟镇[1,2] 吴志祥 Wang Hao

机构地区:[1]南京大学信息管理学院,江苏南京210023 [2]江苏省数据工程与知识服务重点实验室,江苏南京210023 [3]南京工业大学经济管理学院,江苏南京211816

出  处:《情报理论与实践》2021年第5期166-172,共7页Information Studies:Theory & Application

基  金:国家社会科学基金重大招标项目“情报学学科建设与情报工作未来发展路径研究”(项目编号:17ZDA291);南京大学“文科青年跨学科团队专项”项目“面向人文计算的方志文本的语义分析和知识图谱研究”(项目编号:010814370113)的成果;江苏青年社会科学英才和南京大学仲英青年学者等人才培养计划的支持。

摘  要:[目的/意义]命名实体识别作为文本挖掘领域的一个研究重点,是信息检索、问答系统、信息抽取等多个领域的研究基础。目前针对历史文本的研究相对较少,尤其缺乏历史文本中的命名实体识别相关研究。[方法/过程]为了较好地识别出历史事件名,笔者尝试建立深度学习模型BiLSTM-CRF进行命名实体识别。此外,基于这种模型识别了时间、地点、人物这三个辅助元素作为事件的补充信息,对不同实体的识别特性进行对比分析。[结果/结论]发现历史事件名实体识别F1值能达到95.02%。对于辅助实体元素,除地点实体F1值低于80%,其他实体元素均表现较好,F1值能达到80%以上,说明该模型具有良好的识别性及可移植性。[局限]数据标注量还不够充分,标注粒度还可以进一步细化。[Purpose/significance] Named entity recognition,as a research focus in the field of text mining,is the research foundation in many fields such as information retrieval,question answering systems,information extraction. [Method/process] In order to better identify the names of historical events,the author attempts to establish deep learning model Bi LSTM-CRF for named entity recognition. In addition,the author still recognizes the three auxiliary elements of time,place,and person based on this model as supplementary information for the event,compares and analyzes the recognition characteristics of different entities. [Result/conclusion] It is found that the F1 value of historical event name entity recognition can reach 95. 02%. For the auxiliary entity elements,except the location entity F1 value is lower than 80%,other entity elements perform well,and the F1 value can reach more than 80%,indicating that the model in this paper has good recognizability and portability. [Limitations]The amount of data annotation is not enough,and the granularity of annotation can be further refined.

关 键 词:命名实体识别 历史事件名 事件辅助元素 Bi LSTM-CRF 深度学习模型 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术] TP18[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象