中文实体关系抽取研究  被引量:7

Research on Chinese entity relation extraction

在线阅读下载全文

作  者:牟晋娟[1] 包宏[1] 

机构地区:[1]北京科技大学信息工程学院,北京100083

出  处:《计算机工程与设计》2009年第15期3587-3590,共4页Computer Engineering and Design

基  金:国家973重点基础研究发展计划基金项目(2007CB613507)

摘  要:针对基于特征向量的实体关系抽取方法中特征向量一般构造方法存在的不足,提出了基于互信息的实体对特征向量构造方法。该方法引入词和实体关系类别之间的互信息作为一个句子中实体对左右两边上下文特征提取的判断标准,并对实体关系类别特征词条进行编码,在此基础上再对实体对左右两边的上下文信息进行编码。这样做压缩了实体对上下文信息编码的维数,突出了实体关系各类别特性。实验结果表明本文的实体关系特征向量构造方法提高了中文实体关系抽取的准确率和召回率。Toovercomethedefectsoffeaturevectortraditionalconstruction, a method offeature vector construction is brought forward, which is based on mutual information. The method introduces mutual information between word and entity relation type as a standard to extract the feature of entity pair context in a sentence and codes the feature word of entity relation type, then codes the context of entity pair. The method not only compress the dimensions of the context coding, but also highlights the character of entity relation types. Ex- periments show that the method improves the precision and recall of Chinese entity relation task.

关 键 词:信息抽取 实体关系抽取 特征向量 互信息 支持向量机 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象