基于知识规则的Excel数据质量校验工具  被引量:3

Excel Data Quality Validation Tool Based on Knowledge Rules

在线阅读下载全文

作  者:苏贤明[1] 沈志宏[1] 刘宁[1] 

机构地区:[1]中国科学院计算机网络信息中心科学数据中心,北京100190

出  处:《科研信息化技术与应用》2012年第3期29-37,共9页E-science Technology & Application

基  金:中国科学院计算机网络信息中心青年基金项目(CNIC_QN_09007)

摘  要:在分析现有数据质量校验方法与校验工具的基础上,借鉴科研领域的数据质量校验经验和规则引擎的相关技术,实现了基于知识规则的Excel数据质量校验工具,进而解决科研观测数据中异常记录判别、异常原因标识、数据可视化分析等关键技术问题。中国生态系统研究网络综合中心以及土壤分中心的应用表明,在不影响原有数据填报流程的前提下,该工具能很好地代替数据质量校验人员的手工查错工作,有效地提高数据质量校验的效率及准确性。Reviewing the existing methods and tools for data quality validation, this paper presents the development of an Excel data quality validation tool based on the customized knowledge rules database, learned from the experiences of data quality validation in scientific research. A number of key technical issues were solved in the research and observational data such as the discrimination of exception record, the identity of the reason for the exception, data visualization analysis and so on. The applications in Institute of Geographical Sciences and Natural Resources Research and Nanjing Institute of Soil, Chinese Academy of Sciences, showed that the tool could take the place of manual troubleshooting work and improve the efficiency and accuracy greatly in the data quality validation under the premise that the existing data reporting process was not affected.

关 键 词:知识规则 EXCEL 数据质量校验 

分 类 号:N94[自然科学总论—系统科学]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象