数据ETL过程中的数据质量控制  被引量:14

Data quality control for data ETL process

在线阅读下载全文

作  者:胡逢彬[1] 沈炜[1] 

机构地区:[1]湛江师范学院商学院,湛江524048

出  处:《信息技术》2006年第4期19-21,共3页Information Technology

基  金:湛江师范学院科研项目(W0428)

摘  要:分析产生数据质量问题的原因,并对数据质量问题进行了分类,建立数据质量评价的量化标准。提出通过模式集成解决模式层次上的数据质量问题,通过数据清洗解决实例层次上的数据质量问题,并概述了数据清洗算法,提出分四步进行数据ETL数据清洗。This paper analyzes the cause of the data quality problems. Data quality problems are classified, and the quantifying standard of data quality evaluation is established. Data quality problems for the model level and the instance level are respectively solved by the model integration and data cleaning. Data cleaning algo rithms are summarized and data cleaning for data ElL is carried out through the four steps.

关 键 词:数据ETL 数据质量 数据质量控制 数据清洗 

分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象