基于树核函数的中英文代词消解  被引量:23

Pronoun Resolution in English and Chinese Languages Based on Tree Kernel

在线阅读下载全文

作  者:孔芳[1,2] 周国栋[1,2] 

机构地区:[1]苏州大学计算机科学与技术学院自然语言处理实验室,江苏苏州215006 [2]江苏省计算机信息处理技术重点实验室,江苏苏州215006

出  处:《软件学报》2012年第5期1085-1099,共15页Journal of Software

基  金:国家自然科学基金(90920004,61003153);国家高技术研究发展计划(863)(2012AA011102);国家教育部博士点基金(200802850006)

摘  要:基于树核函数,提出了从使用中心理论、集成竞争者信息和融入语义角色相关信息这3个方面对结构化句法树进行动态扩展来提升中英文代词消解的性能.首先探索了3种基本结构化句法树捕获方案,并使用SVMLight中提供的卷积树核函数直接进行基于结构化句法树的相似度计算,从而完成指代消解任务;其次,在分析3种结构化句法树捕获方案的基础上,从中心理论、竞争者信息和语义角色相关信息等几方面对捕获的结构化句法树进行了扩展;最后,通过ACE 2004 NWIRE英文语料和ACE 2005 NWIRE中文语料上的实验,说明了这些扩展能够提升代词消解的性能.This paper proposes a tree kernel method to anaphora resolution of pronouns in both English and Chinese.First,several basic structured tree spans are proposed according to linguistic intuition.The similarity between two structured objects is computed directly using SVMLight.Then,a dynamic-expansion scheme is proposed to automatically determine a proper tree span for pronoun resolution by the centering theory,antecedent competitor-related information,and semantic role-related information.Evaluation on both the ACE 2004 English NWIRE corpus and the ACE 2005 Chinese NWIRE corpus justified the effectiveness of this method.

关 键 词:代词消解 结构化句法树 树核函数 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象