估计一个蛋白质家族属于一个新折叠子的概率  

ESTIMATE THE PROBABILITY OF WHETHER A PROTEIN FAMILY CONTRIBUTES A NEW FOLDS

在线阅读下载全文

作  者:吕波[1] 刘心声[2] 

机构地区:[1]南京航空航天大学高新技术研究院,南京210016 [2]南京航空航天大学理学院,南京210016

出  处:《南京大学学报(数学半年刊)》2011年第1期88-96,共9页Journal of Nanjing University(Mathematical Biquarterly)

基  金:国家自然科学基金(10971097;10732040);国家973计划(2007CB936204)资助

摘  要:关于蛋白质家族、结构和新功能的统计推断是应用数理统计的一个前沿交叉研究方向.本文以蛋白质结构分类数据库SCOP和序列分类数据库Pfam为基础,结合SCOP数据库的动态信息,我们估计出覆盖当前Pfam数据库所需的折叠子总数;通过SCOP中新增家族在Pfam中的对应家族所属的折叠子是否已知为先验信息构建贝叶斯模型,估计了不同规模的Pfam家族贡献新折叠子的概率分布.The statistical inference for the protein families,structures and new functions is a frontier research field in the applied statistics.Based on the SCOP(Structural Classification of Proteins database)and Pfam(Sequence Classification database),and the dynamic information of the SCOP database,we first estimate the total number of the folds,which are needed to cover the current Pfam database.By constructing the Bayesian Model with the prior information of whether the folds are previously known which cover the Pfam families mapping by the newly appeared SCOP families,we then estimate the probability distributions of whether a Pfam family with given size contributes a new folds.

关 键 词:蛋白质家族 新折叠子 概率 贝叶斯方法 

分 类 号:Q51[生物学—生物化学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象