检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:王皆恒 李校[1] WANG Jie-Heng;LI Xiao(Sichuan Key Laboratory of Molecular Biology and Biotechnology,College of Life Sciences,Sichuan University,Chengdu 610064,China)
机构地区:[1]四川大学生命科学学院四川省分子生物与生物技术重点实验室,成都610064
出 处:《四川大学学报(自然科学版)》2020年第5期1009-1014,共6页Journal of Sichuan University(Natural Science Edition)
基 金:国家自然科学基金(61001149)。
摘 要:蛋白质-DNA相互作用位点在各类生理生化反应中扮演重要角色.本论文旨在构建一种可以准确预测"相互作用位点"的方法:PdDNA,其内容主要包括支持向量机和序列匹配器.支持向量机通过提取相互作用位点中心残基的特征进行训练并分类,序列匹配器则通过蛋白质特征矩阵(PSSM)对氨基酸序列进行相关性评估,对二者结果进行归一化整合,得到最终的预测结果.利用公开数据集PDNA62,我们的PdDNA预测准确率为86.87%.为进一步验证PdDNA可靠性,我们还自建了PDNA224数据集,其预测准确率为83.07%,处于较高水平.因此PdDNA是一种有效的"蛋白质-DNA相互作用位点"预测方法.Protein-DNA binding sites play an important role in various physiological and biochemical reactions.In this paper,we establish a special method and algorithm based on Bioinformatics to forecast Protein-DNA binding sites,we call it PdDNA.According to our method we have 2 mainly algorithm:SVM-based predictor and sequence-based predictor.SVM-based predictor is trained and classified by extracting features of central residues at binding sites,and sequence-based predictor scores amino acid sequences for correlation by Position-Specific Scoring Matrix(PSSM).Normalization and integration of the two results to obtain the final forecast.According to our algorithm,it predicts DNA-binding sites with 86.87%accuracy when tested on PDNA62 dataset.Otherwise,we established PDNA224 data set,and PdDNA also has 83.07%accuracy at a high level.Therefore,PdDNA is an effective method for predicting"Protein-DNA binding sites".
关 键 词:蛋白质-DNA相互作用位点预测 支持向量机 序列匹配算法
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.117