检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:唐楠[1] 杨志豪[1] 林鸿飞[1] 李彦鹏[1]
机构地区:[1]大连理工大学计算机科学与技术学院,辽宁大连116024
出 处:《计算机工程》2011年第10期184-186,共3页Computer Engineering
基 金:国家自然科学基金资助项目(60373095;60673039);国家"863"计划基金资助项目(2006AA01Z151)
摘 要:从生物医学文献中抽取蛋白质交互作用关系对蛋白质知识网络的建立、新药的研制等均具有重要的意义。为此,提出一种基于多核学习的方法,用于从文献中自动抽取蛋白质关系信息。该方法融合基于特征的核、树核以及图核,并扩展最短路径依存树以及依存路径以利用更多的上下文关系信息。在AImed语料上的实验得到63.9%的F值和87.83%的AUC值,表明该方法具有较好的性能。Automatic extracting protein-protein interaction information from biomedical literature can help to build protein relation network and design new drugs.This paper presents a multiple kernels learning based approach to automatically extract protein-protein interactions from biomedical literature.The approach combines feature-based kernel,tree kernel and graph kernel.In particular,it extends shortest path-enclosed tree and dependency path tree to capture richer contextual information.Experimental evaluations show that the method can achieve state-of-the-art performance with respect to comparable evaluations,with 63.9% F-score and 87.83% AUC on the AImed corpus.
关 键 词:文本挖掘 信息抽取 蛋白质关系抽取 核方法 多核学习
分 类 号:TP311.12[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7