Web数据转换模式映射优化方法  被引量:1

Web Data Exchange Schema Mapping Optimization Method

在线阅读下载全文

作  者:纪宇航 李贵[1] 李征宇[1] 韩子扬[1] 曹科研 

机构地区:[1]沈阳建筑大学信息与控制工程学院,辽宁 沈阳

出  处:《数据挖掘》2020年第1期76-89,共14页Hans Journal of Data Mining

摘  要:Web数据转换是Web异构数据源集成的重要研究之一,通常分为实例层和模式层两方面进行。本文的研究主要针对模式层,由于给定的源到目标模式映射通常使数据转换结果包含大量冗余,为了生成不含冗余的数据作为数据转换核解,本文设计了一种基于同态关系的模式映射设计与优化方法。该方法首先引入模式映射之间的同态关系作为模式映射重写方法基础,通过对模式映射进行分解,定义不同规则生成的数据冗余的大小程度,确定需要重写的规则。最后将给定的模式映射重写为能够直接生成核解的核模式映射,并将其转换为可执行的SQL语句来计算核解。本文实验使用来自中国土地市场网的数据验证本文方法的有效性。Web data exchange is one of the important researches on the integration of Web heterogeneous data sources. It is usually divided into two aspects: instance layer and schema layer. The research in this paper is mainly focused on the mode layer. Because a given source-to-target mode mapping usually makes the data exchange results contain a lot of redundancy, in order to generate data without redundancy as a data exchange kernel solution, this paper designs a homomorphic rela-tionship Schema mapping design and optimization methods. This method first introduces the ho-momorphic relationship between the schema mappings as the basis of the schema mapping re-writing method. By decomposing the schema mappings, defining the degree of data redundancy generated by different rules, and determining the rules that need to be rewritten. Finally, the given schema mapping is rewritten into a kernel schema mapping that can directly generate a kernel so-lution, and it is converted into an executable SQL statement to calculate the kernel solution. This paper uses data from China Land Market Network to test the performance of the proposed method.

关 键 词:Web大数据 数据转换 模式映射 核解 同态关系 

分 类 号:TP3[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象