检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]厦门大学信息科学与技术学院,福建厦门361005
出 处:《生物信息学》2012年第2期112-115,共4页Chinese Journal of Bioinformatics
基 金:国家自然科学基金(61001013;61102136);福建省自然科学基金(2011J05158)
摘 要:蛋白质折叠问题被列为"21世纪的生物物理学"的重要课题,他是分子生物学中心法则尚未解决的一个重大生物学问题,因此预测蛋白质折叠模式是一个复杂、困难、和有挑战性的工作。为了解决该问题,我们引入了分类器集成,本文所采用的是三种分类器(LMT、RandomForest、SMO)进行集成以及188维组合理化特征来对蛋白质类别进行预测。实验证明,该方法可以有效表征蛋白质折叠模式的特性,对蛋白质序列数据实现精确分类;交叉验证和独立测试均证明本文预测准确率超过70%,比前人工作提高近10个百分点。Protein folding problem is listed as an important issue of 21 st century bio - physics and it is a major unresolved biological problem for the central dogma of molecular biology, so predicting protein folding model is a complex, difficult and challenging work. It is introduced an ensemble classifier to solve such this problem. We use three classifiers (LMT, Random Forest, and SMO) and the 188 -dimensional combination of characteristics algorithm for analyzing and predicting the class of protein fold pattern. Experiments show that it can predict the type of protein fold pattern effectively by using the ensemble classifier and classify the experimental data accurately. Cross -validation and independent testing have proved that the accuracy rate can be higher than 70%, improving by close to 10 percent than previous work.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:18.222.183.63