检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]湖南农业大学湖南省作物种质创新与资源利用重点实验室,长沙410128 [2]湖南农业大学植物病虫害生物学与防控湖南省重点实验室,长沙410128
出 处:《吉林大学学报(工学版)》2017年第2期639-646,共8页Journal of Jilin University:Engineering and Technology Edition
基 金:高等学校博士学科点专项科研基金项目(20124320110002);长沙市科技计划项目(K1406018-21)
摘 要:为了提高HIV-1型蛋白酶剪切位点的预测准确性,提出一种基于特征选择和支持向量机的剪切位点预测模型。首先,通过对5830个样本的HIV-1型蛋白酶剪切位点数据集进行分析,根据最小冗余最大相关理念,采用可自动终止法选择剪切位点的特征向量;然后,将特征向量输入到支持向量机进行学习和训练,建立HIV-1型蛋白酶剪切位点的分类模型;最后,采用Matlab 2014的仿真工具箱进行仿真测试。实验结果表明:本文模型在特征最少的条件下,剪切位点预测精度优于参比模型及文献报道,且所选择的特征向量具有较好的可解释性及生物学意义。In order to improve the prediction accuracy of the HIV-1 protease cleavage site, a shear prediction model based on feature selection and support vector machine is proposed. First, by analysis of the cleavage site dataset of 5830 samples, and using absorption minimum redundancy maximum relevance concept, the automatic termination method is employed to select the cleavage site feature vectors. Then, the feature vector is input to a support vector machine for learning and training to build the classification model of splice sites. Finally, simulation is carried out using MATLAB 2004 simulation toolbox. Results show that the proposed model has better prediction accuracy than that of the reference models and literature report. The selected features have good interpretability and biological significance.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.15