检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:赵保学[1] 李战怀[1] 陈群[1] 潘巍[1] 姜涛[1] 金健[1]
出 处:《计算机应用研究》2013年第5期1405-1409,共5页Application Research of Computers
基 金:国家自然科学基金资助项目(61033007);国家"973"重点基础发展规划基金资助项目(2012CB316203);国家"863"高技术研究发展基金资助项目(2012AA011004);西北工业大学研究生创业种子基金资助项目(Z2012128)
摘 要:为解决MapReduce处理多个查询时效率低下的问题,提出了一种基于查询共享的MapReduce查询优化方法——ShareOpt优化。通过分析所有查询的操作模式,找出其中共享的子查询部分,并根据子查询的执行顺序构造执行计划有向图(DAG),最终确定一组查询的整体执行计划。通过与Hive和Pig的对比,验证了该方法能够在保证准确性的情况下有效地减少执行步数,提高查询执行的效率。To improve the multi-query processing efficiency for MapReduce, this paper proposed a multi-query optimization approach based on sub-query sharing and merging. Firstly, it analyzed the patterns of all the queries and identified those sub- queries which had sharing opportunities and could be merged. Next it constructed a directed aeyclic graph (DAG) according to the sub-queries execution sequences. It added the non-sharing sub-queries to the DAG graph and finally got the overall exe- cution plan for the queries. Experiment results show that the approach can effectively eliminate unnecessary re-computation and save query execution time.
关 键 词:查询优化 MAPREDUCE 查询共享 执行计划
分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.43