非平衡数据集分类方法探讨  被引量:9

Discussion of Classification for Imbalanced Data Sets

在线阅读下载全文

作  者:职为梅[1] 郭华平[1] 范明[1] 叶阳东[1] 

机构地区:[1]郑州大学信息工程学院,郑州450052

出  处:《计算机科学》2012年第B06期304-308,共5页Computer Science

基  金:国家自然科学基金项目(60773048)资助

摘  要:由于数据集中类分布极不平衡,很多分类算法在非平衡数据集上失效,而非平衡数据集中占少数的类在现实生活中通常具有显著意义,因此如何提高非平衡数据集中少数类的分类性能成为近年来研究的热点。详细讨论了非平衡数据集分类问题的本质、影响非平衡数据集分类的因素、非平衡数据集分类通常采用的方法、常用的评估标准以及该问题中存在的问题与挑战。Because of imbalanced class distribution,most classifiers lose efficiency with it.In fact the rarely occurring class in imbalanced datasets shows statistical significance.The problem of learning from imbalanced datasets has attracted growing attention in recent years.The paper provided a comprehensive review of the classification of imbalanced datasets,the nature of the problem,the factor which affected the problem,the current assessment metrics used to evalua-te learning performance,as well as the opportunities and challenges in the learning from imbalanced data.

关 键 词:非平衡数据集 分类 抽样技术 代价敏感学习 

分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象