依存信息在蛋白质关系抽取中的作用  被引量:2

The Role of Dependency Information for Protein-Protein Interaction Extraction

在线阅读下载全文

作  者:刘兵[1,2] 钱龙华[1,2] 徐华[1,2] 周国栋[1,2] 

机构地区:[1]苏州大学计算机科学与技术学院,江苏苏州215006 [2]苏州大学自然语言处理实验室,江苏苏州215006

出  处:《中文信息学报》2011年第2期21-26,共6页Journal of Chinese Information Processing

基  金:国家自然科学基金资助项目(60873150;90920004;61003153;BK2010219)

摘  要:基于核函数的蛋白质关系(PPI)抽取可以捕获结构化信息,取得了较高的性能,但其计算复杂度过高。该文结合词汇、句法等信息,重点探讨了依存信息对基于特征向量的蛋白质关系(PPI)抽取的影响。在多个PPI语料库上的实验表明,依存信息和基本短语块信息可以有效提高基于特征向量的PPI抽取性能。特别要指出,在AIMed语料上的PPI抽取取得了54.7的F测度,是目前基于特征向量的PPI抽取系统的最好水平。Kernel-based PPI(Protein-Protein Interaction) extraction systems can achieve better performance because of their capability to capture structural information,but at the expense of high computational complexity.This paper investigates the combination of diverse lexical,syntactic and particularly dependency information for feature-based protein-protein interaction extraction using SVMs.Experimental evaluation on multiple PPI corpora reveals that dependency information as well as base phrase chunking information is very effective for feature-based PPI extraction.Particularly,our method achieves a promising performance of 54.7 in F-measure on the AIMed corpus,surpassing other state-of-the-art feature-based ones.

关 键 词:蛋白质关系抽取 支持向量机 依存信息 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象