基于隐马尔可夫模型的DNA序列识别  被引量:7

Recognition of DNA Sequences Based on Hidden Markov Models

在线阅读下载全文

作  者:罗泽举[1] 李艳会[2] 宋丽红[3] 朱思铭[2] 

机构地区:[1]重庆工商大学计算机科学与信息工程学院,重庆400067 [2]中山大学数学与计算科学学院,广东广州510275 [3]重庆工商大学实验实习中心,重庆400067

出  处:《华南理工大学学报(自然科学版)》2007年第8期123-126,共4页Journal of South China University of Technology(Natural Science Edition)

基  金:国家自然科学基金资助项目(10371135);重庆市教育委员会科学技术研究项目(KJ0707022)

摘  要:利用隐马尔可夫模型训练中不同结构的DNA序列的L值分布范围不同的特点,对传统多类投票模型进行改进,提出一种优于传统算法的快速训练算法,该算法只需训练出一类隐马尔可夫模型参数.对DNA内含子和外显子序列进行识别,平均识别率达到了90.8%.与支持向量机相比,隐马尔可夫模型在解决多分类问题方面具有优势,不但计算时间少,而且识别率高.According to the distribution variation of the L value with the DNA sequence structure in the hidden Markov model (HMM) training and by improving the traditional muhiclass vote model, a fast training algorithm superior to the traditional One is proposed to recognize the intron and exon of the DNA sequence. The proposed algorithm only need to train one class of parameter of HMM model and the average accuracy rate of it reaches 90. 8%. As compared with the support vector machine, the proposed HMM model is more feasible in the multiclass classification and is of less time cost and higher recognition rate.

关 键 词:隐马尔可夫模型 DNA序列 内含子 外显子 识别 快速训练算法 

分 类 号:TP18[自动化与计算机技术—控制理论与控制工程] O29[自动化与计算机技术—控制科学与工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象