基于Apache AsterixDB的相似性查询  

Similarity query Based on Apache AsterixDB

在线阅读下载全文

作  者:杜伍 陈琳[1] DU Wu;CHEN Lin(Yangtze University,Jingzhou 434000,China)

机构地区:[1]长江大学,湖北荆州434000

出  处:《电脑知识与技术》2020年第5期3-4,15,共3页Computer Knowledge and Technology

摘  要:在许多应用程序中,例如数据清理,记录链接,Web搜索和文档分析,相似性查询处理变得越来越重要。该方法使用现有的运行时运算符来实现这种复杂的联接算法,而无须重新发明轮子。这样可以使系统自动受益于这些操作员的未来改进。该方法包括一种技术,该技术通过使用很大程度上以系统用户级查询语言表示的模板,在查询优化期间将相似性联接计划转换为基于操作员的有效物理计划;这项技术大大简化了这种转换规则的规范。我们使用并行大数据管理系统Apache AsterixDB来说明和验证我们的技术。我们使用并行计算集群上的几个大型真实数据集进行了一项实验研究,以评估相似性查询支持。In many applications,such as data cleansing,logging links,Web searches,and document analysis,similarity query processing becomes increasingly important.The method USES existing runtime operators to implement this complex join algorithm without reinventing the wheel.This allows the system to automatically benefit from future improvements by these operators.The method includes a technique that converts the similarity join plan into an operator-based valid physical plan during query optimization by using templates that are largely expressed in the system user-level query language;This technique greatly simplifies the specification of this transformation rule.We use the parallel big data management system Apache AsterixDB to illustrate and validate our technology.We conducted an experimental study using several large real data sets on parallel computing clusters to evaluate similarity query support.

关 键 词:大数据管理系统 APACHE AsterixDB 相似性查询 并行数据库 优化 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象