在属性级别上处理噪声数据的数据清洗算法  被引量:12

Noisy-data-disposing Algorithm of Data Clean on the Attribute Level

在线阅读下载全文

作  者:王石[1] 李玉忱[1] 刘乃丽[1] 王素青[1] 

机构地区:[1]山东大学计算机科学与技术学院,济南250061

出  处:《计算机工程》2005年第9期86-87,227,共3页Computer Engineering

摘  要:噪声数据的处理是数据清洗的一个重要环节。文章提出一个基于聚类分析的在属性级别上处理噪声数据的算法。该算法通过聚类分析确认噪声数据产生噪声的具体属性,同时统计噪声在属性上的分布规律,这些统计数据可以在下一步的工作中进一步提高数据质量。The dispose of the noisy data is an important part in data cleaning. This paper presents a clustering-based method to dispose noisy data on the level of attribute. This method finds the attribute that makes noise by clustering analysis. Meanwhile, it gets the noise trend in the attributes and this information can be used subsequently to improve the quality of the data.

关 键 词:数据清洗 聚类 噪声数据 数据质量 

分 类 号:TP311[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象