融合浅层句法分析的蛋白质互作用信息抽取方法  被引量:2

Protein-protein interaction extraction method using shallow parsing

在线阅读下载全文

作  者:钱伟中[1] 王娟[1] 傅翀[1] 秦志光[1] 

机构地区:[1]电子科技大学计算机科学与工程学院,成都610054

出  处:《计算机应用研究》2011年第3期972-975,共4页Application Research of Computers

基  金:国家高科技发展规划项目(2006AA01Z411)

摘  要:针对传统基于机器学习方法在蛋白质互作用信息抽取中的缺陷,提出融合浅层句法分析的信息抽取方法,该方法将候选的句子进行浅层句法分析,包括对短语切分、同位语分析、并列结构分析、句子切分的处理。经过该步骤,句子被划分为多个单独的语法单元。然后,对每个语法单元采用基于最大熵的分类方法进行蛋白质互作用信息抽取。该方法在BC-PPI语料库中获得了62.1%的F1性能。比较实验结果表明,该方法能有效减少误判和漏判,提高信息抽取的性能。In order to solve problems of protein-protein interaction extraction based on traditional machine learning methods,this paper proposed an information extraction method using shallow parsing.This method first processed candidate sentences by shallow parsing including phrase chunking,appositive parsing,coordinative parsing and sentence splitting.After this step,divided sentences into multiple individual grammar units.Secondly,extracted protein-protein interactions from each unit using maximum entropy classification method.Tested in the BC-PPI corpus,this method achieved F1 value of 62.1%.Comparative experiments show the method decreases false positives and false negatives efficiently and improves performances of information extraction.

关 键 词:蛋白质互作用 信息抽取 浅层句法分析 最大熵 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象