基于支持向量机的生物医学文献蛋白质关系抽取  被引量:20

Extraction of information on protein-protein interaction from biomedical literatures using an SVM

在线阅读下载全文

作  者:杨志豪[1] 洪莉[2] 林鸿飞[1] 李彦鹏[1] 

机构地区:[1]大连理工大学电子与信息工程学院,辽宁大连116024 [2]朝阳师范高等专科学校数学计算机系,辽宁朝阳122000

出  处:《智能系统学报》2008年第4期361-369,共9页CAAI Transactions on Intelligent Systems

基  金:国家自然科学基金资助项目(60373095,60673039);国家“863”高科技计划资助项目(2006AA01Z151)

摘  要:从生物医学文献中抽取蛋白质(基因)交互作用关系对蛋白质知识网络的建立、蛋白质关系的预测以及新药的研制等均具有重要的意义.提出了一种基于支持向量机(SVM)的蛋白质(基因)交互作用关系抽取方法.该方法除了选取词项特征、关键词特征、实体距离特征、链接特征外,还利用链接语法分析方法可以获得较高准确率的特性,引入链接语法分析方法抽取结果特征.实验结果表明,该方法的召回率性能与使用同一测试语料的其他系统相比具有明显的优势,综合分类率F指标也高于其他系统.Automated extraction of protein-protein interaction information from biomedical literature is helpful when building a protein knowledge network, predicting protein functions and designing new drugs. This paper presents .a method for protein-protein interaction extraction from biomedical literature using a support vector machine (SVM).In this method, besides common index parameters such as word features, keyword features, entity distance features and link path features, a link grammar extraction feature is used to improve precision when identifying protein-protein interactions. Experimental results indicated that the recall rate and the F-score of this method are much higher than that of other extraction systems for the same dataset.

关 键 词:关系抽取 链接语法 支持向量机 

分 类 号:R318[医药卫生—生物医学工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象