检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]苏州大学计算机科学与技术学院,江苏苏州215006 [2]江苏省计算机信息处理技术重点实验室,江苏苏州215006
出 处:《计算机研究与发展》2012年第5期1072-1085,共14页Journal of Computer Research and Development
基 金:国家自然科学基金项目(60873150,90920004,61003153);高等学校博士学科点专项科研基金项目(200802850006);国家“八六三”高技术研究发展计划基金项目(2012AA011102)
摘 要:深入研究了中英文指代消解中的待消解项识别问题.在前人工作的基础上,首先使用规则方法识别与上下文无关或具有显著固定模式的非待消解项;针对与上下文相关的非待消解项识别,从平面特征方法和结构化树核函数方法两方面入手进行了探索;利用复合核函数将平面特征和结构化特征有效结合,对待消解识别问题进行了进一步研究.在ACE2003英文语料和ACE2005中文语料上的实验结果表明,提出的多种待消解项识别方案各具特色,都取得了不错的性能.最后将得到的待消解项识别模块应用于中英文的指代消解任务.实验结果表明,合适的待消解项识别能够大大提高中英文指代消解的性能.This paper systematically explores noun phrase anaphoricity determination for coreference resolution in both English and Chinese languages in various ways. Firstly, a rule-based method is used to detect the non-anaphors which are insensitive to the context or have some obvious patterns. Then, both flat feature-based and structured tree kernel-based methods are used to determinate the non- anaphors sensitive to the context. Finally, a composite kernel is proposed to combine the flat features with structured ones to further improve the performance. Experimental results on both the ACE 2003 English corpus and the ACE 2005 Chinese corpus show that all the proposed methods perform well on anaphoricity determination. In addition, the anaphoricity determination module is applied to coreference resolution systematically. Experimental also results show that proper anaphoricity determination can significantly improve the performance of coreference resolution in both English and Chinese languages.
关 键 词:待消解项识别 规则方法 平面特征方法 结构化树核函数方法 复合核函数
分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.28