检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:张正凡 都仪敏 ZHANG Zheng-fan;DU Yi-min(Faculty of Information Engineering and Automation,Kunming University of Science and Technology,Kunming 650500,China)
机构地区:[1]昆明理工大学信息工程与自动化学院,云南昆明650500
出 处:《软件导刊》2018年第11期37-39,44,共4页Software Guide
摘 要:传统数据库处理分析大量历史数据的性能有限,无法达到满意效果。针对该问题,通过对商立方体的研究,提出等价区间的概念,并利用区间之间的独立性,使商立方体能更好地适应分布式环境下的查询。同时,提出了商立方体在Spark集群上的并行查询算法,充分利用等价区间点查询面命中的特性,使在保证查询有效的情况下尽可能并行化。最后,通过实验验证了算法高效性。Traditional database processing has limited performance in analyzing large amounts of historical data and cannot achieve satisfactory results.Aiming at this problem,through the study of the business cube,we propose the concept of equivalence interval.The independence between the intervals is used to make the quotient cube better adapt to the query in the distributed environment.At the same time,the parallel query algorithm of the business cube on the Spark cluster is proposed,which makes full use of the characteristics of the equivalent interval point query surface hit so as to ensure parallelization as much as possible while ensuring the query is valid.Finally,the efficiency of the algorithm is verified by experiments.
关 键 词:商立方体 大数据 SPARK MAPREDUCE 等价类
分 类 号:TP301[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.20.224.152