一种有效的不完整数据分类器  被引量:5

Effective Classifier for Incomplete Data

在线阅读下载全文

作  者:陈景年[1,2] 黄厚宽[1] 田凤占[1] 邱桃荣[1] 

机构地区:[1]北京交通大学计算机与信息技术学院,北京100044 [2]山东财政学院信息与计算科学系,济南250014

出  处:《计算机科学》2008年第9期162-164,共3页Computer Science

基  金:国家自然科学基金(60503017和60673089)资助

摘  要:在模式识别、机器学习以及数据挖掘中,分类是一个基本而又重要的问题。虽有大量的分类器应运而生,但由于处理不完整数据的复杂性,它们大都是针对完整数据的。然而,由于各种原因,现实中的数据通常是不完整的。因此,对不完整数据分类器的研究具有重要意义。通过分析以往在分类过程中对不完整数据的处理方法,提出了一种不完整数据分类器:DBCI。在DBCI的训练过程中,将缺失值的频数按比例地分配到其它观测值的频数中。因此,不完整数据集所包含的信息可以得到充分利用。在12个标准的不完整数据集上的实验结果表明,与分类效果显著的不完整数据分类器RBC相比,DBCI具有更高的分类效率和更稳定的性能,并且它的分类准确率可以与RBC相媲美。Classification is an elementary and important problem in pattern recognition,machine learning and data mining. Though many classifiers have been proposed,most of them deal with complete data,which is due to the complexity of dealing with incomplete data. Yet actual data sets are often incomplete because of various kinds of reason. So the study of classifiers for incomplete data is of great significance. With the analysis of main methods of processing incomplete data for classification, a new classifier for incomplete data denoted as DBCI is presented. In the training process of DBCI, frequencies of missing values are distributed proportionally across frequencies of other observed values. So the information contained in incomplete datasets can be sufficiently utilized. Experiments are carried out on twelve benchmark incomplete data sets. Compared to the remarkable Robust Bayes Classifier (RBC) that is very effective for classifying incomplete data,DBCI is more efficient and more stable and its classification accuracy is cobble to that of RBC.

关 键 词:分类 贝叶斯方法 不完整数据 

分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论] TP391.4[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象