检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:王昊[1,2] 王雪颖 孟镇[1,2] 吴志祥 Wang Hao
机构地区:[1]南京大学信息管理学院,江苏南京210023 [2]江苏省数据工程与知识服务重点实验室,江苏南京210023 [3]南京工业大学经济管理学院,江苏南京211816
出 处:《情报理论与实践》2021年第5期166-172,共7页Information Studies:Theory & Application
基 金:国家社会科学基金重大招标项目“情报学学科建设与情报工作未来发展路径研究”(项目编号:17ZDA291);南京大学“文科青年跨学科团队专项”项目“面向人文计算的方志文本的语义分析和知识图谱研究”(项目编号:010814370113)的成果;江苏青年社会科学英才和南京大学仲英青年学者等人才培养计划的支持。
摘 要:[目的/意义]命名实体识别作为文本挖掘领域的一个研究重点,是信息检索、问答系统、信息抽取等多个领域的研究基础。目前针对历史文本的研究相对较少,尤其缺乏历史文本中的命名实体识别相关研究。[方法/过程]为了较好地识别出历史事件名,笔者尝试建立深度学习模型BiLSTM-CRF进行命名实体识别。此外,基于这种模型识别了时间、地点、人物这三个辅助元素作为事件的补充信息,对不同实体的识别特性进行对比分析。[结果/结论]发现历史事件名实体识别F1值能达到95.02%。对于辅助实体元素,除地点实体F1值低于80%,其他实体元素均表现较好,F1值能达到80%以上,说明该模型具有良好的识别性及可移植性。[局限]数据标注量还不够充分,标注粒度还可以进一步细化。[Purpose/significance] Named entity recognition,as a research focus in the field of text mining,is the research foundation in many fields such as information retrieval,question answering systems,information extraction. [Method/process] In order to better identify the names of historical events,the author attempts to establish deep learning model Bi LSTM-CRF for named entity recognition. In addition,the author still recognizes the three auxiliary elements of time,place,and person based on this model as supplementary information for the event,compares and analyzes the recognition characteristics of different entities. [Result/conclusion] It is found that the F1 value of historical event name entity recognition can reach 95. 02%. For the auxiliary entity elements,except the location entity F1 value is lower than 80%,other entity elements perform well,and the F1 value can reach more than 80%,indicating that the model in this paper has good recognizability and portability. [Limitations]The amount of data annotation is not enough,and the granularity of annotation can be further refined.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.135.218.96