检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]南京莱斯信息技术股份有限公司,南京210007
出 处:《指挥信息系统与技术》2012年第5期79-84,共6页Command Information System and Technology
摘 要:数据清洗可以提高数据质量。介绍了数据清洗规则库设计方法,该方法基于编程语言的反射技术和Python脚本技术实现数据清洗,可以方便、灵活且高效地解决数据清洗中错误数据的问题,具有扩展性强、易于实现和开发成本低等特点。The data quality can be improved by data cleaning. The method for designing the sim- ple rule base with data cleaning is introduced. The reflection technology based on the program- ming language and the Python scripts technology are used to realize the data cleaning. By using these technologies, the problems of erroneous data in the data cleaning process can be solved. The method has features of strong expansibility, easy realization and low development cost.
关 键 词:数据清洗 规则库 反射技术 Python脚本 规则处理引擎
分 类 号:TP311[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.124