针对字典序依赖的分布式数据修复  

DISTRIBUTED DATA REPAIRING FOR LEXICOGRAPHICAL ORDER DEPENDENCE

在线阅读下载全文

作  者:郭乃网 覃晟 谈子敬[2] 曹满亮 Guo Naiwang;Qin Sheng;Tan Zijing;Cao Manliang(State Grid Shanghai Municipal Electric Power Company,Shanghai 200437,China;Fudan University,Shanghai 200433,China)

机构地区:[1]国网上海市电力公司电力科学研究院,上海200437 [2]复旦大学,上海200433

出  处:《计算机应用与软件》2023年第9期37-42,108,共7页Computer Applications and Software

基  金:科技部重点研发计划项目(2018YFB1402600);上海市科委项目(19DZ2252800);国网上海市科技项目(52094020001A)。

摘  要:字典序次序依赖用于表达数据上属性列间的次序关系。现实数据往往具有很大的规模而且包含错误。研究针对字典序次序依赖的分布式数据修复技术,目标是将数据修改为满足给定次序依赖定义的形式。基于Spark平台,设计和实现分布式修复算法,同时通过实验验证该方法的有效性和运行效率。Lexicographical order dependencies can define order specifications on lists of attributes.In practice,data are large and contain errors.This paper investigated the problem of distributed data repairing for lexicographical order dependencies,aiming at repairing data such that order dependencies defined on the data were satisfied.We designed and implemented distributed algorithms based on Spark framework,and conducted extensive experiments to verify the effectiveness and efficiency of our approach.

关 键 词:数据修复 字典序次序依赖 分布式计算 

分 类 号:TP3[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象