利用决策树方法对蛋白质鉴定结果二次评价  

Re-evaluating the Protein Identification Results Based on Decision Tree Model

在线阅读下载全文

作  者:于长永[1] 王国仁[1] 吴俊杰[1] 毛克明[1] 

机构地区:[1]东北大学信息科学与工程学院,辽宁沈阳110004

出  处:《小型微型计算机系统》2010年第4期678-681,共4页Journal of Chinese Computer Systems

基  金:国家自然科学基金项目(60803026)资助;教育部新教师基金项目(20070145112)资助

摘  要:为了有效地利用蛋白质串联质谱数据,进一步提高蛋白质鉴定的准确性,提出一种基于决策树的蛋白质鉴定结果的二次评价算法.目前,串联质谱已经成为解决蛋白质鉴定问题的最为有效的技术手段.随着蛋白质串联质谱数据的大量聚集,蛋白质鉴定算法也日益增加.然而,现有的蛋白质鉴定算法通常返回数量庞大的结果列表,因此对列表中的鉴定结果进行二次评价是提高蛋白质鉴定准确性的一个重要环节.针对此问题,首先利用频繁模式挖掘方法获得了b离子的特征信息,进而基于决策树理论提出一种蛋白质鉴定结果的二次评价算法-即ReCheck算法.实验结果表明,该算法有效的提高了蛋白质鉴定的准确性.To efficiently use the protein tandem mass spectra data and improve the accuracy of the protein identification,a results re-evaluation method is proposed based on a decision tree model.Recently,tandem mass spectrometry has become the most powerful tool for protein identification due to its high sensitivity and accuracy,and many protein identification algorithms have been proposed.However,searching protein database by use of spectra often returns a rank which contains a huge number of results,therefore the results re-evaluation is an important step for improving the accuracy of identification.Focusing on this problem,the frequent pattern mining method is first used to discover the characteristics of the b-ions and then a result re-evaluation algorithm named ReCheck is proposed based on the decision tree model.The experimental results show ReCheck algorithm improves the accuracy of the protein identification.

关 键 词:蛋白质鉴定 串联质谱 数据挖掘 决策树 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象