用于不均衡数据集的挖掘方法  被引量:5

Data Mining on Imbalanced Data Sets

在线阅读下载全文

作  者:赵凤英[1,2] 王崇骏[1,2] 陈世福[1,2] 

机构地区:[1]南京大学计算机软件新技术国家重点实验室,南京210093 [2]南京大学计算机科学与技术系,南京210093

出  处:《计算机科学》2007年第9期139-141,共3页Computer Science

基  金:国家自然科学基金(No.60503021);江苏省自然科学基金(No.BK2005075);江苏省高技术研究计划(No.BG2006027)的资助

摘  要:传统的分类算法大多是基于数据集中各类的样本数是基本均衡的假设的,而实际应用场合中面临的往往是不均衡数据。针对不均衡数据集,利用传统的分类方法往往不能获得良好的性能,因而研究用于处理不均衡数据集的分类方法就显得相当重要,本文对相关的研究做了综述。The majority of machine learning algorithms previously designed usually assume that their training sets are well-balanced,but data in real-world is usually imbalanced. The tradition machine learning algorithms on balanced data sets have bad performance when they learn from imbalanced data sets. Thus, machine learning on imbalanced data sets becomes an urgent problem. In this paper, a simple review of the related work is informed.

关 键 词:不均衡数据集 过取样 欠取样 代价敏感学习 

分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象