检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:刘冰静 郭红[1] LIU Bingjing GUO Hong(College of Mathematics and Computer Science, Fuzhou University, Fuzhou, Fujian 350116, China)
机构地区:[1]福州大学数学与计算机科学学院,福建福州350116
出 处:《福州大学学报(自然科学版)》2017年第1期16-24,共9页Journal of Fuzhou University(Natural Science Edition)
基 金:福建省自然科学基金资助项目(2012J05114);福建省产学研重大专项基金资助项目(2012G106)
摘 要:提出一种蛋白质亚细胞定位预测方法.该方法以位置特异性得分矩阵和基因本体抽取对应特征,结合支持向量机构建多标签分类模型.充分考虑了蛋白质进化信息对其亚细胞定位的影响,并基于文本分类中涉及到的卡方检验的对数变换思想,构建基因本体注释信息的加权系数对其进行加权处理,从而提高预测的准确率.采用支持向量机作为基分类器构建多标签分类模型,进一步提高预测的准确率.通过在目前该领域两个常用的真实数据集上进行的一系列测试结果表明,该方法能有效提高蛋白质亚细胞定位预测的准确率.This paper puts forward a computational method for the problem of predicting protein subcellular localization. It uses features of the position specific scoring matrix (PSSM) and gene ontology (GO), and uses the support vector machine (SVM) to construct a classifier. This method considers the effect of evolutionary information to the subcellular location and also employs text mining method a logarithmic transformation of CHI to determine weight for GO features to achieve higher precision. Furthermore, using SVM as base classifier to construct multi-label classification model, it is performed on two benchmark datasets. The application result shows that the proposed method effectively improves the accuracy of prediction of protein subcellular localization.
关 键 词:定位预测 蛋白质亚细胞 位置特异性得分矩阵 基因本体 多标签分类
分 类 号:TP399[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.222