检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:陈国良 尧海昌[1,2] 陈帅 吴梦雪 方厚之 法虎 孟朝霞 刘尚东 王汝传[1] 季一木[1,3,4,5] CHEN Guoliang;YAO Haichang;CHEN Shuai;WU Mengxue;FANG Houzhi;FA Hu;MENG Zhaoxia;LIU Shangdong;WANG Ruchuan;JI Yimu(School of Computer Science,Nanjing University of Posts and Telecommunications,Nanjing 210023,China;School of Computer and Software,Nanjing Vocational University of Industry Technolog,Nanjing 210023,China;Institute of High Performance Computing and Bigdata,Nanjing University of Posts and Telecommunications,Nanjing 210023,China;Nanjing Center of HPC China,Nanjing 210023,China;Jiangsu HPC and Intelligent Processing Engineer Research Center,Nanjing 210023,China)
机构地区:[1]南京邮电大学计算机学院,江苏南京210023 [2]南京工业职业技术大学计算机与软件学院,江苏南京210023 [3]南京邮电大学高性能计算与大数据处理研究所,江苏南京210023 [4]国家高性能计算中心南京分中心,江苏南京210023 [5]江苏省高性能计算与智能处理工程研究中心,江苏南京210023
出 处:《南京邮电大学学报(自然科学版)》2020年第5期11-26,共16页Journal of Nanjing University of Posts and Telecommunications:Natural Science Edition
基 金:国家重点研发计划专项(2017YFB0202203);江苏省重点研发计划(BE2017166);江苏省自然科学基金(BK20170900);江苏省六大人才高峰项目(19KJB520046);南京邮电大学鼎山人才培养对象项目;江苏省高等学校自然科学研究项目(19KJD520006);江苏省研究生科研创新计划(KYCX19_0906);江苏省现代教育技术立项课题(2019-R-67748);江苏省教育厅工业软件工程技术研究开发中心开放基金资助项目。
摘 要:大数据一体机作为大数据时代的基础设施,其自主安全可控显得尤为重要。基因数据因其巨大的社会价值、经济价值及军事价值,其安全是国家安全的一部分。因此,存储、分析与处理基因数据是国产处理器大数据一体机的重要应用之一。文中首先介绍了国产处理器大数据一体机和基因序列文件主要格式,然后分为无参考序列基因压缩算法和基于参考序列基因压缩算法综述了FASTA格式基因数据压缩技术及基因压缩并行化技术的发展历程和研究现状,同时在国产处理器大数据一体机上验证了近年来优秀基因压缩算法的性能。研究面向国产处理器大数据一体机的基因压缩技术对解决基因数据安全和基因压缩技术自主可控具有很重要的意义,也为我国基因处理技术的全面国产化提供了参考。As an infrastructure in the era of big data,an independent,safe and controllable big data machine is particularly important.Because of its huge social value,economic value and military value,genomic data are a part of national security.Therefore,storing,analyzing and processing genomic data is one of the important applications of the domestic processor big data machine.This paper firstly introduces the domestic processor big data machine and the main file formats of the genome sequence,and then reviews the reference-free genome compression algorithms and the reference-based genome compression algorithms.Meanwhile,the paper verifys the performance of the state-of-the-art genome compression algorithms in recent years on the domestic processor big data machine.The research on the genome compression technology for domestic processor big data machine is of great significance to solving the safety problems of genomic data and the independent control of the genome compression technology.The technology provides a reference for the domestic production of genome processing technologies in China.
分 类 号:TP391[自动化与计算机技术—计算机应用技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.137.162.63