基于云计算的多重查询优化系统  被引量:3

Multiple Query Optimization System Based on Cloud Computing

在线阅读下载全文

作  者:葛星[1] 沈耀[1] 徐常亮 

机构地区:[1]上海交通大学计算机科学与工程系,上海200240 [2]阿里云计算有限公司,杭州310099

出  处:《计算机工程》2014年第9期46-50,58,共6页Computer Engineering

基  金:国家"863"计划基金资助重大项目"以支撑电子商务为主的网络操作系统研制"(2011AA01A202)

摘  要:在常规海量数据分析作业中,CPU/IO密集型的查询语句通常复杂、耗时并存在大量可复用的公共部分。如何检测、共享和复用回归查询集中语句间的公共部分成为亟需解决的问题。为此,提出特征值索引方法,并构建适用于云计算场景的LSShare多重查询优化系统。基于查询语句的抽象语法树将语句划分为不同的查询层次,针对每个查询层次抽取特征向量并计算特征值。建立简单高效的特征值索引表以识别多重查询语句间的公共部分,并结合SQL重写技术来复用其中的公共部分。随着运行迭代次数的增加,LSShare系统将逐步优化云计算场景中的回归查询集。实验结果表明,该系统在运行效率上优于传统查询语句系统,可节约近1/3的执行时间。In routine massive data analysis queries,the CPU/IO intensive analysis queries are complex and timeconsuming,but share common components. It is challenging to detect,share and reuse the common components among thousands of SQL-like queries. Aiming at these problems,this paper proposes the signature-index approach and implements the LSShare system to solve the Multiple Query Optimization(MQO)problem in the cloud with a recurring query set. It generates signatures for each query based on Abstract Syntax Tree(AST). Then it makes a simple but efficient index for further identifying and sharing common components of multiple queries combined with SQL-rewriting techniques. LSShare system gradually optimizes regression query set in the cloud computing scene as the superposition of run number. Experimental results demonstrate,the system is superior to the traditional query optimization in share equally,and it can save nearly a third of the execution time.

关 键 词:云计算 多重查询优化 查询处理 子表达式识别 海量数据处理 回归查询集 

分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象