检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:秦凯伟[1,2] 孔芳[1,2] 李培峰[1,2] 朱巧明[1,2]
机构地区:[1]苏州大学计算机科学与技术学院,苏州215006 [2]江苏省计算机信息处理技术重点实验室,苏州215006
出 处:《计算机科学》2012年第10期278-281,共4页Computer Science
基 金:国家自然科学基金(90920004;60970056;61070123;61003153);江苏省高校自然科学重大基础研究项目(08KJA520002);苏州市科技计划项目(SYG201112)资助
摘 要:提出了一个基于规则的中文零指代项识别方法,即输入一个句法分析树,根据这个句法分析树得到当前词的最小IP子树,再依据得到的IP子树提出中文零指代识别的一些规则。所用的语料是Ontonotes。从实验结果可以看到,该方法在标准的句法分析树上F值能达到82.45%,在自动句法树上其也能达到66.45%。从实验结果可以看出,该方法在中文零指代识别上具有很好的性能。A rule-based approach for Chinese zero anaphor detection was proposed.Given a parse tree,the smallest IP sub-tree covering the current predicate was captured.Based on this IP sub-tree,some rules were proposed for detecting whether a Chinese zero anaphor exists.This paper also systematically evaluated the rule-based method on OntoNotes corpus.Using golden parse tree,our method achieves 82.45 in F-measure.And the F-measure is 63.84 using automatic parser.The experiment results show that our method is very effective on Chinese zero anaphor detection.
关 键 词:自然语言处理 中文零指代 句法分析树 基于规则 Ontonotes3.0
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.17.61.107