恐怖袭击事件实体语料库构建  

Construction of Entity Corpus for Terrorist Attack Event

在线阅读下载全文

作  者:李林瑛[1] 王孙和 曲云平 LI Linying;WANG Sunhe;QU Yunping(School of Software,Dalian University of Foreign Languages,Dalian 116044,China)

机构地区:[1]大连外国语大学软件学院,辽宁大连116044

出  处:《现代信息科技》2024年第19期44-47,52,共5页Modern Information Technology

基  金:2022年辽宁省研究生教育教学改革研究项目(LNYJG2022423);辽宁省教育厅高等学校基本科研项目(LJKMZ20221549)。

摘  要:针对恐怖袭击事件文本语料库匮乏的问题,文章制定了恐怖袭击事件的实体标注规范,通过对全球恐怖主义数据库(GTD)的数据进行实体标注,构建了恐怖袭击事件的实体语料库。同时,针对数据标注工作的高人力和高时间成本问题,由于百度通用信息抽取(Universal Information Extraction,UIE)模型在极小样本上具有较强的泛化能力,采用UIE模型进行辅助标注。实验结果证明了标注方案的有效性,并在一定程度上减少了标注时间。In views of the scarcity problem of terrorist attack event text corpus,a standard for entity annotation of terrorist attack event is established in this paper.Through entity annotation of data from the Global Terrorism Database(GTD),an entity corpus for terrorist attack events is constructed.At the same time,for the problems of high human power and high time cost of data annotation work,the Baidu Universal Information Extraction(UIE)model is used for the auxiliary annotation because of its strong generalization ability on small samples.The experimental results demonstrate that the annotation scheme is effective and it reduces the annotation time to some extent.

关 键 词:恐怖袭击事件 实体语料库 通用信息抽取 全球恐怖主义数据库 命名实体识别 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象