检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:于长永[1] 王国仁[1] 毛克明[1] 翟文丹[1]
机构地区:[1]东北大学信息科学与工程学院,辽宁沈阳110004
出 处:《小型微型计算机系统》2010年第3期404-407,共4页Journal of Chinese Computer Systems
基 金:国家自然科学基金项目(60803026)资助;教育部新教师基金(2070145112)资助;国家"八六三"高技术研究发展计划项目(2006AA09Z139;2007AA01Z192;2009AA012150)资助
摘 要:为了有效的利用蛋白质串联质谱数据,提高蛋白质鉴定的准确性,提出一种基于KNN的蛋白质序列与蛋白质串联质谱的匹配打分算法.蛋白质序列与蛋白质串联质谱的匹配打分是蛋白质数据库搜索鉴定过程中的关键技术.然而,现有的算法没有很好的利用蛋白质串联质谱中离子的强度信息.针对此问题,本文根据质谱中离子的类型给出了全体离子的一个合理的划分,进而抽象出一个高维的强度特征向量,在已知的高精度的数据集上建立了强度匹配知识集合,最后基于KNN技术构造了序列和质谱的匹配打分算法.实验结果表明,本文算法更加有效的利用了蛋白质串联质谱的结构信息,提高了蛋白质鉴定的准确性.A scoring approach is proposed for protein identification which evaluates the matching between protein sequence and protein tandem mass spectra based on KNN technology in a database search sketch.The scoring method between protein sequence and spectrum has been the key technique for protein identification in database search approaches.However,the available approaches do not make the best use of the intensity information of the ions in the spectrum.Focusing on this problem,we propose a method making use of the intensity information to improve the accuracy of the protein identification.A high-dimensional vector is extracted based on the total intensity of the same kind of ions in the spectrum and a KNN based scoring method is proposed.Experimental results showed that the proposed approach can effectively improve the accuracy of protein identification.
分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.58