检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:潘越 王骏[1,2,3] 李文飞[1,2] 张建 王炜[1,2] Pan Yue;Wang Jun;Li Wenfei;Zhang Jian;wang Wei(School of Physics,Nanjing University,Nanjing,210023,China;Institute for Brain Sciences,Nanjing University,Nanjing,210023,China;State Key Laboratory for Novel Software Technology of Nanjing University,Department of Computer Science and Technology,Nanjing University,Nanjing,210023,China)
机构地区:[1]南京大学物理学院,南京210023 [2]南京大学脑科学研究院,南京210023 [3]南京大学计算机软件新技术国家重点实验室,南京大学计算机科学与技术系,南京210023
出 处:《南京大学学报(自然科学版)》2020年第5期744-753,共10页Journal of Nanjing University(Natural Science)
基 金:国家自然科学基金(11774157,11774158,11974173,11934008)。
摘 要:通过蛋白质的序列、结构等信息构建完整的蛋白质宇宙是生物信息学中的重要课题,相关研究对蛋白质结构预测、蛋白质进化路径分析以及蛋白质结构设计等方面的研究都有重要的意义.从蛋白质结构的一种简化表示——蛋白质接触图出发,通过训练卷积神经网络进行特征提取,筛选出可识别结构域折叠类型的最小特征向量,构建蛋白质折叠类型空间,并使用谱聚类等方法对不同蛋白质折叠类型的高维分布情况进行分析.得到的最小特征向量兼顾了信息的完整性与冗余度,可以很好地表示全部七种常见蛋白质类的空间关联.该研究结果填补了之前蛋白质宇宙研究中对不常见类的空间位置和相互关系描述的空白,加深了对于蛋白质结构相似性的理解.Establishing an entire protein universe from sequential and structural information is a key problem in bioinformatics,and is of great importance in protein structure prediction,protein evolution analysis and protein structure design. In this paper,starting from a simplified representaion of protein structure,contact map,we trained a deep convolutional neural network(DCNN) and studied the shortest feature vectors that were able to recognize different protein folds correctly. We constructed a space of protein folds spanned with these shortest feature vectors,and analyzed the highdimensional distribution with spectral clustering and other methods. With these shortest feature vectors, both information integrity and redundance are considered and all the seven common protein classes and their spatial relationships can be characterized. Our research fills gaps in the description of spatial position and relationship of classes which is absent from previous researches and may improve the understanding on similarity between protein classes.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.21.126.72