一种新颖的蛋白质序列与其串联质谱的匹配打分算法  被引量:1

Novel Scoring Approach for Protein Sequence and Protein Tandem Mass Spectrum

在线阅读下载全文

作  者:于长永[1] 王国仁[1] 毛克明[1] 翟文丹[1] 

机构地区:[1]东北大学信息科学与工程学院,辽宁沈阳110004

出  处:《小型微型计算机系统》2010年第3期404-407,共4页Journal of Chinese Computer Systems

基  金:国家自然科学基金项目(60803026)资助;教育部新教师基金(2070145112)资助;国家"八六三"高技术研究发展计划项目(2006AA09Z139;2007AA01Z192;2009AA012150)资助

摘  要:为了有效的利用蛋白质串联质谱数据,提高蛋白质鉴定的准确性,提出一种基于KNN的蛋白质序列与蛋白质串联质谱的匹配打分算法.蛋白质序列与蛋白质串联质谱的匹配打分是蛋白质数据库搜索鉴定过程中的关键技术.然而,现有的算法没有很好的利用蛋白质串联质谱中离子的强度信息.针对此问题,本文根据质谱中离子的类型给出了全体离子的一个合理的划分,进而抽象出一个高维的强度特征向量,在已知的高精度的数据集上建立了强度匹配知识集合,最后基于KNN技术构造了序列和质谱的匹配打分算法.实验结果表明,本文算法更加有效的利用了蛋白质串联质谱的结构信息,提高了蛋白质鉴定的准确性.A scoring approach is proposed for protein identification which evaluates the matching between protein sequence and protein tandem mass spectra based on KNN technology in a database search sketch.The scoring method between protein sequence and spectrum has been the key technique for protein identification in database search approaches.However,the available approaches do not make the best use of the intensity information of the ions in the spectrum.Focusing on this problem,we propose a method making use of the intensity information to improve the accuracy of the protein identification.A high-dimensional vector is extracted based on the total intensity of the same kind of ions in the spectrum and a KNN based scoring method is proposed.Experimental results showed that the proposed approach can effectively improve the accuracy of protein identification.

关 键 词:蛋白质鉴定 串联质谱 数据库搜索 匹配打分 

分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象