检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:纪宇航 李贵[1] 李征宇[1] 韩子扬[1] 曹科研
出 处:《数据挖掘》2020年第1期76-89,共14页Hans Journal of Data Mining
摘 要:Web数据转换是Web异构数据源集成的重要研究之一,通常分为实例层和模式层两方面进行。本文的研究主要针对模式层,由于给定的源到目标模式映射通常使数据转换结果包含大量冗余,为了生成不含冗余的数据作为数据转换核解,本文设计了一种基于同态关系的模式映射设计与优化方法。该方法首先引入模式映射之间的同态关系作为模式映射重写方法基础,通过对模式映射进行分解,定义不同规则生成的数据冗余的大小程度,确定需要重写的规则。最后将给定的模式映射重写为能够直接生成核解的核模式映射,并将其转换为可执行的SQL语句来计算核解。本文实验使用来自中国土地市场网的数据验证本文方法的有效性。Web data exchange is one of the important researches on the integration of Web heterogeneous data sources. It is usually divided into two aspects: instance layer and schema layer. The research in this paper is mainly focused on the mode layer. Because a given source-to-target mode mapping usually makes the data exchange results contain a lot of redundancy, in order to generate data without redundancy as a data exchange kernel solution, this paper designs a homomorphic rela-tionship Schema mapping design and optimization methods. This method first introduces the ho-momorphic relationship between the schema mappings as the basis of the schema mapping re-writing method. By decomposing the schema mappings, defining the degree of data redundancy generated by different rules, and determining the rules that need to be rewritten. Finally, the given schema mapping is rewritten into a kernel schema mapping that can directly generate a kernel so-lution, and it is converted into an executable SQL statement to calculate the kernel solution. This paper uses data from China Land Market Network to test the performance of the proposed method.
关 键 词:Web大数据 数据转换 模式映射 核解 同态关系
分 类 号:TP3[自动化与计算机技术—计算机科学与技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:3.148.243.252