模式生物的外显子、内含子和基因间序列的识别(英文)  

The Identification of Exon Intron and Intergenic DNA in the Model Species Genomes

在线阅读下载全文

作  者:陈翠霞[1] 李前忠[1] 林昊[1] 

机构地区:[1]内蒙古大学理工学院物理系,呼和浩特010021

出  处:《内蒙古大学学报(自然科学版)》2005年第2期166-172,共7页Journal of Inner Mongolia University:Natural Science Edition

基  金:国家自然科学基金项目 (3 0 1 6 0 0 2 5)~~

摘  要:基于核酸序列在剪切位点上保守性、组分的不同和编码序列阅读框架的3周期性,模式生物全基因组序列分为外显子、内含子和基因间序列三类.三个标准离散源分别由64个三联体在整条序列上的概率和4个碱基序列首尾(剪切位点附近)共30个位点上的概率共同构成.某条序列的类型就由该序列的离散量同相应区间上三个标准离散量的离散增量确定.结果表明:具有184个信号参数的离散量预测比只有64个三联体参数的结果要高出5%,总体预测成功率:线虫为87.37%,拟南芥为91.08%,果蝇为92.28%,原核生物大肠杆菌的二种序列预测率为92.88%,酵母菌为94.88%.Based on the conservation of nucleotides around splice sites,and the compositional feature and the existence of reading frames with 3-periodicity in a coding sequence,the complete sequences of the 5 model species genomes are grouped under three kinds:intron,exon and intergenic DNA. The three standard sources of diversity are respectively determined by the probabilities (bp/kb) of the 64 trimers and of the 4 bases at 30 positions around the splice sites. The classification of one sequence can be determined by the increment of diversity. The prediction results with 184 information signals of all sets are better than that only with 64 signals. The prediction accuracy with 184 signals are respectively about 87.37%, 91.08%, 92.28%,92.88% and 94.88% for C.elegans(C),A.thaliana(A), D.melanogasters (D), E.coli (E) and S.cerevisiae (S) genome.

关 键 词:外显子 内含子 基因间序列 剪切位点 面散增量 

分 类 号:Q61[生物学—生物物理学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象