缺失数据处理方法的比较研究  被引量:13

A Comparison Study of Missing Value Datasets Processing Methods

在线阅读下载全文

作  者:乔珠峰[1] 田凤占[1] 黄厚宽[1] 陈景年[1] 

机构地区:[1]北京交通大学计算机与信息技术学院,北京,100044 北京交通大学计算机与信息技术学院,北京,100044 北京交通大学计算机与信息技术学院,北京,100044 北京交通大学计算机与信息技术学院,北京,100044

出  处:《计算机研究与发展》2006年第z1期171-175,共5页Journal of Computer Research and Development

基  金:国家自然科学基金项目(60503017)

摘  要:由于数据挖掘技术日益广泛地应用于各个领域,而大多数领域中数据都存在缺失值,因此基于缺失数据的数据挖掘方法的研究具有重要意义.利用直接删除、特殊值填充、平均值填充、Robust方法4种处理缺失值的方法建立4个缺失值处理模型以及相应的朴素贝叶斯分类器模型.通过在5个实际数据集上进行实验比较,并采用五重交叉验证来检验这些模型的性能.结果表明,用这些模型处理缺失值构建的朴素贝叶斯分类器是有效的.

关 键 词:数据挖掘 缺失值 朴素贝叶斯分类器 ROBUST 交叉验证 

分 类 号:TP18[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象