检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]沈阳化工大学信息工程学院,辽宁沈阳100142 [2]国网辽宁省电力有限公司铁岭供电公司人力资源部,辽宁铁岭112000
出 处:《化工学报》2013年第12期4662-4666,共5页CIESC Journal
基 金:国家自然科学基金项目(61104093);辽宁省科学研究基金项目(L2012141);辽宁省教学研究基金项目(2011A017)~~
摘 要:由于真核启动子DNA序列结构复杂、数据量巨大,启动子序列辨识一直是一个难点。首先对真核启动子序列寡核苷酸位置分布特征进行高斯混合模型建模,能够将出现频率少但重要的基序提取出来。并将高斯混合模型作为真核启动子最小二乘支持向量机分类器中的核函数,将最小二乘支持向量机模型简化为最小二乘模型,计算量减少。辨识结果表明,该算法的辨识精度优于贝叶斯辨识算法,和RBF核LS-SVM相比,辨识精度基本相同,建模时间略有缩短。Recognition of gene promoter DNA sequence is difficult with the complex structure and the huge amount of data. In this paper, the positional densities of oligonucleotides are modeled by Gaussian mixture model. It can identify less frequent but important motifs, since the positional density is independent of the actual occurrence frequency of the oligonucleotide. These motifs generally correspond to the consensus sequences of transcription factor binding site. GMM is used as eukaryotic promoter LS-SVM kernel, which simplifies the LS-SVM as LS model. The algorithm is simplified and the computational complexity is decreased. The simulation results show the accuracy is improved compared with Bayesian classifier, and is same to LS-SVM with RBF kernel, moreover the model building time is shorter.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.56