基于GMM核的LS-SVM真核启动子模型  

Eukaryotic promoter LS-SVM with GMM kernel

在线阅读下载全文

作  者:郭烁[1] 袁德成[1] 郭娲[2] 

机构地区:[1]沈阳化工大学信息工程学院,辽宁沈阳100142 [2]国网辽宁省电力有限公司铁岭供电公司人力资源部,辽宁铁岭112000

出  处:《化工学报》2013年第12期4662-4666,共5页CIESC Journal

基  金:国家自然科学基金项目(61104093);辽宁省科学研究基金项目(L2012141);辽宁省教学研究基金项目(2011A017)~~

摘  要:由于真核启动子DNA序列结构复杂、数据量巨大,启动子序列辨识一直是一个难点。首先对真核启动子序列寡核苷酸位置分布特征进行高斯混合模型建模,能够将出现频率少但重要的基序提取出来。并将高斯混合模型作为真核启动子最小二乘支持向量机分类器中的核函数,将最小二乘支持向量机模型简化为最小二乘模型,计算量减少。辨识结果表明,该算法的辨识精度优于贝叶斯辨识算法,和RBF核LS-SVM相比,辨识精度基本相同,建模时间略有缩短。Recognition of gene promoter DNA sequence is difficult with the complex structure and the huge amount of data. In this paper, the positional densities of oligonucleotides are modeled by Gaussian mixture model. It can identify less frequent but important motifs, since the positional density is independent of the actual occurrence frequency of the oligonucleotide. These motifs generally correspond to the consensus sequences of transcription factor binding site. GMM is used as eukaryotic promoter LS-SVM kernel, which simplifies the LS-SVM as LS model. The algorithm is simplified and the computational complexity is decreased. The simulation results show the accuracy is improved compared with Bayesian classifier, and is same to LS-SVM with RBF kernel, moreover the model building time is shorter.

关 键 词:高斯混合模型 核函数 最小二乘支持向量机 脱氧核糖核酸 模型简化 算法 

分 类 号:Q61[生物学—生物物理学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象