半监督中文事件抽取中的模板过滤和转换方法  被引量:1

Pattern Filtering and Conversion Methods for Semi-supervised Chinese Event Extraction

在线阅读下载全文

作  者:徐霞[1] 李培峰[2] 朱巧明[2] 

机构地区:[1]苏州大学计算机科学与技术学院,苏州215006 [2]江苏省计算机信息处理技术重点实验室,苏州215006

出  处:《计算机科学》2015年第2期253-255,262,共4页Computer Science

基  金:国家自然科学基金(61272260);江苏省自然基金(BK2011282);江苏省高校自然科学重大基础研究项目(11KIJ520003)资助

摘  要:事件模板是指导事件抽取工作的依据,半监督方法下模板的准确性显得尤为重要。目前,基于双视图的"触发词-论元"模板的中文信息事件抽取系统不能有效地解决触发词一词多义的现象和模板稀疏现象。提出了一种借助论元进行触发词语义消歧的方法,并利用该方法进行模板过滤以消除无效模板的影响。另外,针对几种特殊的中文句型,根据句法结构提出了模板转换规则,从而提高了模板的适用性。在ACE2005中文语料上的测试表明,该方法可有效地提高半监督中文信息事件抽取系统的性能。The accuracy of event patterns is very important in semi-supervised event extraction.Currently,semi-supervised Chinese event extraction system based on the pairwise pattern(e.g.,Trigger-Argument)suffers much from the issues of polysemy of triggers and sparse patterns.This paper put forward a argument-based mechanism to solve trigger sense disambiguation,and then applied it to pattern filtering to eliminate invalid patterns.In addition,for several special Chinese sentence structures,this paper proposed a pattern conversion method based on syntactic structure to enhance the applicability of the pattern.The experimental results on the ACE 2005 Chinese data show that our methods can effectively improve performance of semi-supervised Chinese event extraction system.

关 键 词:事件抽取 模板过滤 模板转换 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象