利用计算方法识别定义内含子保留的基因组特征  被引量:1

Using computational methods to identify genomic features that define intron retention

在线阅读下载全文

作  者:马猛[1] 汪洋[2] 

机构地区:[1]安徽大学计算机科学技术学院,合肥230032 [2]美国北卡罗来纳大学教堂山分校药理学系,美国教堂山275997365

出  处:《计算机工程与应用》2012年第28期36-41,共6页Computer Engineering and Applications

基  金:安徽省自然科学基金(No.1208085QF120);安徽大学博士科研启动基金(No.33190013);国家自然科学基金面上项目(No.61173187)

摘  要:超过90%的人基因都存在选择性剪接。正确识别不同的选择性剪接模式对深刻理解基因剪接调控机制具有重要意义。内含子保留是一种较为常见的基因剪接模式。从基因组序列本身出发,利用计算方法识别定义内含子保留的各种基因组特征,抽取统计意义上显著差异的特征,利用三种分类方法(SVM,NN,NB)对这些基因组特征进行了分类预测验证实验,保留内含子的平均预测精度达到70%,整体平均精度达到90%,取得了良好效果。研究方法也可应用于其他基因剪接模式的研究。Over 90% percent of human genes show alternative splicing. Identifying correctly different alternative splicing events will be meaningful to understand the gene splicing regulatory mechanism. Intron retention is consid- erably common gene splicing event. In this paper, based on the genomic sequences, using various computational methods to identify the genomic features that define intron retention and extracting the statistically different fea- tures, three kinds of classifying methods are used to test the identifying power of these genomic features. The experi- ment result shows that the average precision for retained introns is up to 70% and the average total precision reaches 90% and proves the good identifying power of the genomic features extracted. The studying methods of this paper can be applied to other gene splicing events.

关 键 词:基因剪接 内含子保留 基因组特征 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象