含缺失属性值的问题数据检测与修复  被引量:9

Error data detection and repair in condition of field value missing

在线阅读下载全文

作  者:高科[1] 刁兴春[2] 曹建军[2] 

机构地区:[1]解放军理工大学指挥信息系统学院 [2]总参第六十三研究所

出  处:《计算机工程与设计》2016年第3期643-649,共7页Computer Engineering and Design

基  金:国家自然科学基金项目(61371196);中国博士后科学基金特别基金项目(201003797)

摘  要:为更加准确地对问题数据进行检测及修复,针对存在属性值缺失的情况,提出综合利用数据质量规则与FellegiHolt方法进行数据质量检查的策略。针对不同的检测需求,分别设计以问题数据定位和问题数据修复为目标的检测算法,提出相应算法以解决问题数据的修复以及缺失数据的填充问题。分别利用实例数据与生成数据进行实验,实验结果表明,该方法对问题数据进行检测的召回率和准确率有明显优势,两种检测策略在进行问题数据检测时的效率也有较大差异。To carry out the detection of error data in the condition of field value missing more exactly,an error data detection method based on Fellegi-Holt method and data quality rules was put forward.To meet different requirements,two algorithms were designed to solve the error data location and repairing problems.Algorithms were also put forward to solve the error data repairing and missing data filling problems.Experiments were conducted with both real-life and synthetic data to examine the algorithms.The results show that there is a great improvement in the recall and accuracy rate of error data detection,and the efficiencies of two algorithms differ a lot.

关 键 词:属性值缺失 数据规则 Fellegi-Holt 数据修复 数据填充 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象