检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:杜洁 骆力明[1] 孙众[1] DU Jie;LUO Li-ming;SUN Zhong(College of Information Engineering,Capital Normal University,Beijing 100048,China)
出 处:《计算机工程与科学》2023年第4期711-717,共7页Computer Engineering & Science
基 金:国家自然科学基金(61977048)。
摘 要:信息抽取技术用于从非结构化文本数据中提取关注度较高的信息。事件抽取技术是信息抽取研究领域中具有挑战的研究方向。事件抽取的目的是从非结构化文本数据中抽取描述事件的关键元素,并以结构化的方式呈现。事件抽取被看作序列标注任务,首先采用ALBERT预训练模型学习特征,其次引入条件随机场CRF模型提高序列标注性能,最后完成事件类型以及事件要素的识别分类。在ACE2005标准语料库上的实验结果表明,与现有模型相比,ALBERT-CRF模型在触发词识别和分类任务上的召回率和F值均有所提高。Information extraction technology is used to extract the information with high attention from unstructured text data.Event extraction technology is a challenging research direction in the field of information extraction.The purpose of event extraction is to extract key elements describing events from unstructured text data and present them in a structured way.Event extraction is regarded as a sequence annotation task.Firstly,the ALBERT pre-trained model is used to learn the features.Then,conditional random field is introduced to improve the sequence annotation performance.Finally,the identification and classification of event types and event elements are completed.The experimental results on ACE2005 standard corpus show that,compared with the existing models,ALBERT-CRF model improves the recall rate and F-score in trigger word recognition and classification tasks.
关 键 词:事件抽取 序列标注 ALBERT模型 条件随机场模型
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.15