采用BI-LSTM-CRF模型的数值信息抽取  被引量:10

NUMERICAL INFORMATION EXTRACTION USING BI-LSTM-CRF MODEL

在线阅读下载全文

作  者:王竣平 白宇[1,2] 蔡东风 Wang Junping;Bai Yu;Cai Dongfeng(Human-Computer Intelligence Research,Shenyang Aerospace University,Shenyang 110136,Liaoning,China;Knowledge Engineering and Human-Computer Intelligence Research Center,Shenyang 110136,Liaoning,China)

机构地区:[1]沈阳航空航天大学人机智能研究中心,辽宁沈阳110136 [2]辽宁省知识工程与人机交互工程技术研究中心,辽宁沈阳110136

出  处:《计算机应用与软件》2019年第5期138-144,共7页Computer Applications and Software

基  金:教育部人文社会科学研究项目(17YJCZH003);辽宁省自然科学基金项目(20170540696);沈阳市科技计划项目(17-231-1-82)

摘  要:数值信息是文本中的一种重要信息,含有主体、属性、属性值等元素。然而当前数值信息抽取方法对比较关系的表示比较单一,对于含有多个数值的句子,其数值信息抽取的效果不佳。根据文本中数量关系表述特征,提出一种数值信息表示方法和数值信息抽取框架。根据数值信息中各个元素的特点,利用BI-LSTM-CRF模型对数值信息元素进行识别;利用语言特征判断属性值和其他元素之间的语义关系。该方法对数值信息抽取的准确率、召回率和F值分别达到0.775、0.752和0.763,优于现有的抽取的方法。Numerical information is an important piece of information in a text,containing subject,attribute,and attribute values.However,the current numerical information extraction has a relatively simple representation of the comparison relationship.For a sentence containing multiple values,the extraction effect of numerical information is not good.According to the quantitative relationship in the text,we proposed a numerical information representation method and a numerical information extraction framework.According to the characteristics of each element in the numerical information,BI-LSTM-CRF model was used to identify the elements of the numerical information.Then we used language features to judge the semantic relationship between attribute values and other elements.The accuracy,recall and F value of the method are 0.775,0.752 and 0.763 respectively,which are better than the existing methods.

关 键 词:数值信息表示 语义关系 BI-LSTM-CRF模型 

分 类 号:TP391.1[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象