检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:杨慧 程雪平 Yang Hui;Cheng Xueping(School of Data Science,Guangzhou Huashang College,Guangzhou 511300,China)
出 处:《现代计算机》2023年第18期53-59,共7页Modern Computer
基 金:广州华商学院2022年青年学术科研项目(2022HSXS086)。
摘 要:针对大数据场景下的数据存储格式,通过对比分析存储压缩比、读写性能和数据查询效率等方面的差异,从实验角度探究不同存储格式的优劣势。在实验中,选取了常见的数据存储格式进行了对比研究,包括文本格式、CSV格式、JSON格式、Parquet格式、ORC格式等。通过对比实验结果,得出了在不同场景下,不同的数据存储格式都有其适用性和局限性,需要综合考虑各方面因素选择合适的存储格式。本文的研究结果对于数据存储和处理的优化具有一定的指导意义和参考价值。This article focuses on data storage formats in big data scenarios,and explores the advantages and disadvantages of different storage formats from an experimental perspective by comparing and analyzing the differences in storage compression ratio,read and write performance,and data query efficiency.In the experiment,selected common data storage formats for comparative research,including text format,CSV format,JSON format,Parquet format,ORC format,etc.Through the analysis of comparative experimental results,concluded that different data storage formats have their applicability and limitations in different scenarios,and it is necessary to consider comprehensively various factors to choose a suitable storage format.The research results of this article have certain guiding significance and reference value for optimizing data storage and processing.
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.33