并发内存OLAP查询优化技术研究  被引量:3

Concurrent In-Memory OLAP Query Optimization Techniques

在线阅读下载全文

作  者:张延松[1,2,3] 焦敏[1,2] 张宇[4] 王珊[1,2] Zhang Yansong;Wang Shan;Jiao Min;Zhang Yu(Key Laboratory of Data Engineering and Knowledge Engineering(Renmin University of China),Ministry of Education,Beijing 100872);School of Information,Renmin University of China,Beijing 100872;National Survey Research Center (Renmin University of China),Beijing 100872;National Satellite Meteorological Center,China Meteorological Administration,Beijing 100081)

机构地区:[1]数据工程与知识工程教育部重点实验室(中国人民大学),北京100872 [2]中国人民大学信息学院,北京100872 [3]中国调查与数据中心(中国人民大学),北京100872 [4]中国气象局国家卫星气象中心,北京100081

出  处:《计算机研究与发展》2016年第12期2836-2846,共11页Journal of Computer Research and Development

基  金:国家"八六三"高技术研究发展计划基金项目(2015AA015307);中国人民大学科学研究基金(中央高校基本科研业务费专项资金资助)项目(16XNLQ02)~~

摘  要:基于多核处理器硬件技术和高并发查询负载需求,近年来的研究不仅关注于一次一查询模式的查询优化技术,而且也关注于一次一组模式的查询优化技术.通过将并发查询转换为共享负载,一些低访问延迟的操作,如磁盘I?O、cache访问,可以被多个并发的查询所共享.当前的研究通常基于共享查询操作符,如扫描、连接、谓词处理等,通过生成全局执行计划优化并发查询.对于复杂的分析型负载,如何创建优化的执行计划是一个具有挑战性的问题.在广泛使用的星形模型的基础上提出一种模板OLAP查询执行计划来简化查询执行计划,以达到最大化查询操作符利用率的目标.1)提出了基于代理键的连接索引技术,将传统的基于值探测的连接操作转化为内存数组索引引用(AIR),使连接操作的CPU效率更高并且支持聚集计算的后物化;2)并发查询的谓词处理简化为cache line敏感的谓词向量,在单次cache line访问中最大化并发查询谓词计算性能;3)通过多核并行实现技术在SSB基准上进行测试.实验结果表明:共享扫描和共享谓词处理能够将并发OLAP查询处理性能提升1倍.Recent researches not only focused on query-at-a-time query optimizations but also focusedon group-at-a-time query optimizations due to the multicore hardware architecture support and highlyconcurrent workload requirements.By grouping concurrent queries into shared workload,some highlatency operations,e.g.,disk I/O,cache line access,can be shared for multiple queries.The existingapproaches commonly lie in sharing query operators such as scan,join or predicate processing,and tryto generate an optimized global executing plan for all the queries.For complex analytical workloads,how to generate an optimized shared execution plan is a challenging issue.In this paper,we present atemplate OLAP execution plan for widely adopted star schema to simplify execution plan formaximizing operator utilization.Firstly,we present a surrogate key oriented join index to transformtraditional key probing based join operation to array index referencing(A IR)lookup to make join CPUefficient and support a lazy aggregation.Secondly,the predicate processing of concurrent queries issimplified as cache line conscious predicate vector to maximize concurrent predicate processing withinsingle cache line access.Finally,we evaluate the concurrent template OLAP(on-line analyticalprocessing)processing with multicore parallel implementation under the star schema benchmark(SSB),and the results prove that the shared scan and predicate processing can double the concurrentOLAP query performance.

关 键 词:并发O L A P 查询处理 数组索引引用 模板O L A P查询处理 连接索引 过滤向量 

分 类 号:TP311.5[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象