检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:张汝昌 邱杰 王明堂 陈庆锋[1] ZHANG Ruchang;QIU Jie;WANG Mingtang;CHEN Qingfeng(School of Computer Electronics and Information,Guangxi University,Nanning Guangxi 530004,China;School of Computer Science and Engineering,Yulin Normal University,Yulin Guangxi 537000,China)
机构地区:[1]广西大学计算机与电子信息学院,广西南宁530004 [2]玉林师范学院计算机科学与工程学院,广西玉林537000
出 处:《广西师范大学学报(自然科学版)》2020年第6期40-50,共11页Journal of Guangxi Normal University:Natural Science Edition
基 金:国家自然科学基金(61963004);广西自然科学基金重点项目(2017GXNSFDA19803);广西重点研发计划(桂科AB17195055)。
摘 要:蛋白质的三维空间结构决定该蛋白质的生物功能,研究蛋白质结构的相似性在计算分子生物学中具有重要意义。本文将蛋白质Cα原子距离矩阵分解成许多小的子矩阵表示蛋白质的局部结构,通过对这些局部结构的统计分析得到局部特征频率向量计算蛋白质的相似性,在此基础上提出一种新的基于自适应局部特征频率向量的方法(ALFF)计算蛋白质三维结构相似性。ALFF在选取蛋白质局部特征的方式上,使用OTSU算法确定局部特征最合适的大小m,并通过MeanShift聚类计算出具有代表性的局部特征数量k。实验结果表明,ALFF可以更好更快地划分蛋白质的局部子结构,相对于人工选择参数的方法,ALFF在SCOP蛋白质结构分类中有更高的一致性,与TM-score比较有更好的准确性。The three-dimensional spatial structure of protein determine its biological function.Structural similarity between proteins can be a good predictor of functional correlations.In this paper,the Cα atomic distance matrix of protein is decomposed into many small sub-matrices that represent the local structure of the protein.Through the statistical analysis of these local structures,a local feature frequency vector is obtained to calculate the similarity of the protein.Consequently,a new method to measure the similarity of protein structure by adaptive local feature frequency vector(ALFF)is proposed.In the way of selecting the local features of protein in ALFF,OTSU is adopted to determine the most appropriate size of the local features m,and MeanShift is applied to find the representative number of local features k,respectively.Experimental results demonstrate that ALFF can achieve better and faster division of the local substructures of proteins.In addition,compared with the method of manual selection of parameters,ALFF has higher consistency in protein structure classification and better accuracy in TM-score comparison.
关 键 词:蛋白质结构相似性 局部特征 距离矩阵 聚类 频率向量
分 类 号:TP39[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.138.199.24