面向新闻领域的中文实体关系抽取  被引量:1

Chinese Entity Relationship Extraction for Journalism

在线阅读下载全文

作  者:王博 王侃[2] 王成刚[2] 刘然 刘威鹏 黄慧荣 WANG Bo;WANG Kan;WANG Chenggang;LIU Ran;LIU Weipeng;HUANG Huirong(Beijing Information Technology Research Institution,Beijing 100093,China;Southwest China Institute of Electronic Technology,Chengdu 610036,China;School of Cyber Science and Engineering,Northwestern Polytechnical University,Xi′an 710129,China)

机构地区:[1]北京信息技术研究所,北京100093 [2]中国西南电子技术研究所,成都610036 [3]西北工业大学网络空间安全学院,西安710129

出  处:《电讯技术》2021年第1期50-57,共8页Telecommunication Engineering

摘  要:随着互联网技术的快速发展,人们能够及时地获取大量的新闻文本信息,如何从新闻中自动获取关键信息,把新闻中具有价值的信息转化为结构化数据,从而快速有效地获取有用的知识已是迫切需求。实体关系抽取是获取关键信息的方法之一,但目前关于中文的实体关系抽取工作较少。针对基于长短时记忆网络的中文实体识别模型难于提取长距离的依存关系特征和句法特征问题,提出利用双向树形长短时记忆神经网络提取依存句法树的结构特征。在提取的特征的基础上,使用条件随机场判断实体的类别和边界,并在实体识别模型中加入注意力机制提高模型的性能。在《人民日报》数据集和ACE 2005语料库上训练模型,验证了模型的有效性。With the rapid development of Internet technology,people can obtain a large amount of news without delay.It′s important to automatically obtain key information from the news and convert valuable information in the news into structured data.It′s very urgent to quickly and effectively obtain useful knowledge.Entity relationship extraction is one of the methods to obtain key information.However,at present,there is less research on entity relations extraction of Internet news text data.This paper proposes a bidirectional tree long-short-term memory neural network to extract the structural features from dependency syntactic tree.To improve the performance of the model,conditional random field is used to determine the category and boundary of the entity based on the extracted features,and attention mechanism is added.Finally,the model is trained on the People's Daily dataset and the ACE 2005 corpus to verify the validity.

关 键 词:新闻文本信息 实体关系抽取 长短时记忆网络 最短依存路径 条件随机场 注意力机制 

分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象