检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:王婧[1] 王腾蛟[1] 杨冬青[1] 李红燕[1]
出 处:《计算机研究与发展》2011年第S3期245-253,共9页Journal of Computer Research and Development
基 金:"核高基"重大专项(2010ZX01042-002-002-02;2010ZX01042-001-003-05);国家"十一五"科技支撑计划重点项目(2009BAH44B03);国家自然科学基金项目(60973002);教育部重大项目培育基金项目(708001);微软-北京大学合作项目
摘 要:云计算是当前处理大规模数据分析的重要技术.然而,云计算平台上数据的广泛分布性使多表连接运算代价过高,这是一个迫切需要解决的问题.针对这一问题,首先对云计算环境中已有的多表连接算法进行分析,然后提出一种新的基于过滤器的多表连接算法.对多个表同时进行连接,避免中间结果的产生;通过预先统计连接属性的取值分布,减少不必要的元组复制与数据传输.在TPC-H数据上的实验结果显示,基于过滤器的多表连接算法与Hive及另外两种已有算法相比,显著提高了云计算环境中多表连接运算的效率.云计算是当前处理大规模数据分析的重要技术.然而,云计算平台上数据的广泛分布性使多表连接运算代价过高,这是一个迫切需要解决的问题.针对这一问题,首先对云计算环境中已有的多表连接算法进行分析,然后提出一种新的基于过滤器的多表连接算法.对多个表同时进行连接,避免中间结果的产生;通过预先统计连接属性的取值分布,减少不必要的元组复制与数据传输.在TPC-H数据上的实验结果显示,基于过滤器的多表连接算法与Hive及另外两种已有算法相比,显著提高了云计算环境中多表连接运算的效率.
分 类 号:TP3[自动化与计算机技术—计算机科学与技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.17.61.107