列存储系统面向列的连接顺序优化研究  被引量:1

Column-Oriented Join Order Optimization in Column Store Systems

在线阅读下载全文

作  者:王梅[1] 陆戌辰[1] 乐嘉锦[1] 

机构地区:[1]东华大学计算机科学与技术学院上海201620

出  处:《计算机研究与发展》2013年第7期1473-1483,共11页Journal of Computer Research and Development

基  金:“核高基”国家科技重大专项基金项目(2010ZX01042-001-003-004);国家自然科学基金项目(61070031,61070032,61103046);上海市自然科学基金项目(11ZR1401200)

摘  要:连接操作是影响列存储数据查询效率的重要操作之一.对于列存储系统中的连接操作优化,以往的研究工作大多专注于对数据组织结构的优化以及辅助物理结构的建立上,极少涉及逻辑层特别是早期的连接策略优化.为此,根据列存储数据的特点和分析型查询需求的特征,提出了一种新的列存储连接优化方法.该方法采用提早优化的策略,使用"事实表下推"的优化规则,并在多事实表查询条件下引入浓密树进行连接顺序决策,以较小的时空复杂度获得"最优"的连接执行顺序.使用代价估计模型对提出的连接策略优化方法进行了理论验证.同时,在大规模数据仓库基准数据集SSB上通过实验验证了提早优化机制及下推规则的有效性.Join is one of the column store based queries. most important operations which can largely affect the efficiency of Most work on column-stores is focused on the improving of storage structure and the building of physical auxiliary structures, while the logical plan optimization, especially early join strategy optimization, has seldom been considered. On the basis of this problem, this paper presents a new join strategy optimization method according to the characteristic of column- oriented storage structure and analytical query. We adopt the early optimization strategy in our method and propose a "fact table push-down" rule. In particular, the bushy tree structure will be considered in the multi-fact-table case to receive a "best" join path with small time and space complexity. Then we provide a cost estimation to verify the correctness of the proposed join strategy optimization method. Finally, experimental results on the large-scale data warehouse benchmark data sets SSB also verify the effectiveness of the early optimization strategy and the proposed push-down rule.

关 键 词:数据库 列存储 查询优化 连接策略 规则优化 

分 类 号:TP311.1[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象