检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:李林瑛[1] 王孙和 曲云平 LI Linying;WANG Sunhe;QU Yunping(School of Software,Dalian University of Foreign Languages,Dalian 116044,China)
机构地区:[1]大连外国语大学软件学院,辽宁大连116044
出 处:《现代信息科技》2024年第19期44-47,52,共5页Modern Information Technology
基 金:2022年辽宁省研究生教育教学改革研究项目(LNYJG2022423);辽宁省教育厅高等学校基本科研项目(LJKMZ20221549)。
摘 要:针对恐怖袭击事件文本语料库匮乏的问题,文章制定了恐怖袭击事件的实体标注规范,通过对全球恐怖主义数据库(GTD)的数据进行实体标注,构建了恐怖袭击事件的实体语料库。同时,针对数据标注工作的高人力和高时间成本问题,由于百度通用信息抽取(Universal Information Extraction,UIE)模型在极小样本上具有较强的泛化能力,采用UIE模型进行辅助标注。实验结果证明了标注方案的有效性,并在一定程度上减少了标注时间。In views of the scarcity problem of terrorist attack event text corpus,a standard for entity annotation of terrorist attack event is established in this paper.Through entity annotation of data from the Global Terrorism Database(GTD),an entity corpus for terrorist attack events is constructed.At the same time,for the problems of high human power and high time cost of data annotation work,the Baidu Universal Information Extraction(UIE)model is used for the auxiliary annotation because of its strong generalization ability on small samples.The experimental results demonstrate that the annotation scheme is effective and it reduces the annotation time to some extent.
关 键 词:恐怖袭击事件 实体语料库 通用信息抽取 全球恐怖主义数据库 命名实体识别
分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7