基于工作流程的数据清洗系统  被引量:5

Data clean system based on work flow

在线阅读下载全文

作  者:武小平[1] 左春[2] 

机构地区:[1]中国科学院软件研究所,北京100080 [2]中国科学院研究生院,北京100049

出  处:《计算机工程与设计》2008年第8期1878-1880,共3页Computer Engineering and Design

基  金:国家自然科学基金项目(60573126)

摘  要:建立了一个通用、可扩展的数据清洗系统,从设计思想出发逐步设计了整个清洗系统,并通过工作流引擎管理清洗系统的工作流程,工作流程在执行过程中逐层调用清洗服务、清洗组件并配合知识库完成数据的清洗操作。最后用具体的应用描述了清洗系统是如何按照定义的工作流程完成数据清洗的。该方法设计的清洗系统已成功应用于某市民政局共享平台项目中,实践结果表明,该系统有良好的性能与应用价值。A data clean system is built which is universal, and can be extend easily. A whole process and concept of how to build this data clean system is presented. In this system, the clean process is managed by work flow engine. The work flow executed a data clean process by clean service and knowledge component. Finally, how the data clean tool clean data through a really scene is described. The system is used in civil affairs department's data sharing project, and is proved to have very good value of application.

关 键 词:数据清洗 工作流 组件 知识库 数据质量 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象