基于剪接信号和调节元件序列特征的剪接位点预测方法  被引量:1

在线阅读下载全文

作  者:孙宗晓[1,2] 桑凌洁[1] 居理宁[1] 朱怀球[1,3] 

机构地区:[1]北京大学工学院湍流与复杂系统国家重点实验室生物医学工程系理论生物学中心,北京100871 [2]中国航天员科研训练中心,北京100094 [3]Finnish Genome Center,University of Helsinki,Helsinki 00290,Finland

出  处:《科学通报》2008年第19期2298-2306,共9页Chinese Science Bulletin

基  金:国家重点基础研究发展计划(编号:2003CB715905);国家自然科学基金(批准号:30300071,30770499,10721403);北京大学工学院青年人才基金资助项目

摘  要:结合剪接相关的剪接信号和调节元件的序列特征信息,发展高效的剪接位点预测方法,是真核生物基因预测中一个新课题.运用熵密度分布(EDP)距离方法、权重数组法(WAM)、κ检验等算法建立了剪接位点相关的剪接信号的统计模型,同时基于无监督自学习的基序检测方法建立了调节元件的统计模型,在此基础上设计了基于多层次支持向量机(SVM)的剪接位点预测新算法,实现了真核基因剪接位点的从头(ab initio)预测.对人类基因组剪接位点数据的大规模测试结果表明,本研究提出的方法能够有效地预测人类基因组中的剪接位点,预测水平不仅全面高于传统的基于剪接信号的预测方法GeneSplicer,而且在总体预测精度上达到并大部分超过基于调节元件信号的预测方法SpliceScan.对于低GC含量的基因序列,本文方法的预测精度明显地高于其他两种方法.

关 键 词:基因预测 剪接位点 剪接信号 调节元件 

分 类 号:Q75[生物学—分子生物学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象