检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:张季[1] 周立柱[1] 蒋旭东[1] 冯建华[1]
机构地区:[1]清华大学计算机科学与技术系,北京100084
出 处:《计算机工程与应用》2001年第24期104-107,共4页Computer Engineering and Applications
基 金:国家973重点基础研究发展项目资助(编号:g1998030414)
摘 要:在数据仓库的设计中实物化视图的选择有赖于对cube占用存储空间大小的预测,然而传统的基于数据均匀分布的抽样预测算法不能准确地估计cube的大小。文章介绍了一种利用抽样原理预测cube大小的算法,这种算法能够自适应不同程度的数据倾斜,特别适用于数据倾斜程度较大的情况。实验数据表明,该算法对传统的抽样预测算法有明显的改进效果。In the design of Data Warehouse,the selection of materialized view depends on the estimation of the storage of Cubes.However,the traditional estimation algorithms ,which are based on the assumption of uniformly distributed data,cannot estimate the size of the Cubes accurately.This paper introduces a novel sampling-based cube storage estimation algorithm.This algorithm can automatically adapt to biased data of various degree,especially when the degree is high.Experiments demonstrate its improvement on the traditional algorithms.
关 键 词:CUBE 数据倾斜 数据仓库 联机分析处理 数据库 空间预测算法
分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.145