基于规则的中文零指代项识别研究  被引量:3

Rule-based Identification of Chinese Zero Anaphora

在线阅读下载全文

作  者:秦凯伟[1,2] 孔芳[1,2] 李培峰[1,2] 朱巧明[1,2] 

机构地区:[1]苏州大学计算机科学与技术学院,苏州215006 [2]江苏省计算机信息处理技术重点实验室,苏州215006

出  处:《计算机科学》2012年第10期278-281,共4页Computer Science

基  金:国家自然科学基金(90920004;60970056;61070123;61003153);江苏省高校自然科学重大基础研究项目(08KJA520002);苏州市科技计划项目(SYG201112)资助

摘  要:提出了一个基于规则的中文零指代项识别方法,即输入一个句法分析树,根据这个句法分析树得到当前词的最小IP子树,再依据得到的IP子树提出中文零指代识别的一些规则。所用的语料是Ontonotes。从实验结果可以看到,该方法在标准的句法分析树上F值能达到82.45%,在自动句法树上其也能达到66.45%。从实验结果可以看出,该方法在中文零指代识别上具有很好的性能。A rule-based approach for Chinese zero anaphor detection was proposed.Given a parse tree,the smallest IP sub-tree covering the current predicate was captured.Based on this IP sub-tree,some rules were proposed for detecting whether a Chinese zero anaphor exists.This paper also systematically evaluated the rule-based method on OntoNotes corpus.Using golden parse tree,our method achieves 82.45 in F-measure.And the F-measure is 63.84 using automatic parser.The experiment results show that our method is very effective on Chinese zero anaphor detection.

关 键 词:自然语言处理 中文零指代 句法分析树 基于规则 Ontonotes3.0 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象