一种基于总线模型的数据清洗方法  被引量:2

Data Clean Method Based on Bus Model

在线阅读下载全文

作  者:杨梦宁[1] 赵鹏[1] 张小洪[1] 李朋[1] 

机构地区:[1]重庆大学软件学院,重庆400044

出  处:《计算机科学》2010年第4期224-226,共3页Computer Science

基  金:国家自然科学基金(60975015);重庆市科委科技攻关计划项目(2009AC2057);重庆市科委自然科学基金(2009BB2364);重庆大学青年骨干教师创新能力培育基金资助

摘  要:数据清洗是保证数据质量的重要环节。已有的清洗方法往往过于依赖特定应用,不容易得到重用。从提高数据清洗方法的可重用性和可扩展性的角度出发,提出一种基于总线模型可复用的数据清洗框架。具有相对独立功能的清洗工具以组件的形式,通过适配器挂接到清洗总线上,通过总线控制对清洗组件实现清洗。最后用具体应用来描述基于总线模型的数据清洗方法的工作流程。实践结果证明该方法具有良好的性能和应用价值。Data cleansing is an important part for ensuring data quality. The existing cleaning methods are often too dependent on a specific application, can not be reused. In order to improve the reusability and scalability of the clean method, a data clean framework was build which is based on bus model and reusable. The data clean tool which has independent clean function is registered on the bus through the adapter. The clean function is finished by calling the clean components which is registered on the bus. Finally, how the method works in the really scene was described. The method was proved has good value of application.

关 键 词:数据清洗 总线模型 组件 可复用 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象