基于抽样的Cube占用空间预测算法  

A Novel Sampling-based Cube Storage Estimation Algorithm

在线阅读下载全文

作  者:张季[1] 周立柱[1] 蒋旭东[1] 冯建华[1] 

机构地区:[1]清华大学计算机科学与技术系,北京100084

出  处:《计算机工程与应用》2001年第24期104-107,共4页Computer Engineering and Applications

基  金:国家973重点基础研究发展项目资助(编号:g1998030414)

摘  要:在数据仓库的设计中实物化视图的选择有赖于对cube占用存储空间大小的预测,然而传统的基于数据均匀分布的抽样预测算法不能准确地估计cube的大小。文章介绍了一种利用抽样原理预测cube大小的算法,这种算法能够自适应不同程度的数据倾斜,特别适用于数据倾斜程度较大的情况。实验数据表明,该算法对传统的抽样预测算法有明显的改进效果。In the design of Data Warehouse,the selection of materialized view depends on the estimation of the storage of Cubes.However,the traditional estimation algorithms ,which are based on the assumption of uniformly distributed data,cannot estimate the size of the Cubes accurately.This paper introduces a novel sampling-based cube storage estimation algorithm.This algorithm can automatically adapt to biased data of various degree,especially when the degree is high.Experiments demonstrate its improvement on the traditional algorithms.

关 键 词:CUBE 数据倾斜 数据仓库 联机分析处理 数据库 空间预测算法 

分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象