非平衡数据集分类问题研究进展  被引量:16

Research and Advancement of Classification Method of Imbalanced Data Sets

在线阅读下载全文

作  者:高嘉伟[1] 梁吉业[1] 

机构地区:[1]山西大学计算智能与中文信息处理省部共建教育部重点实验室

出  处:《计算机科学》2008年第4期10-13,共4页Computer Science

基  金:国家自然科学基金(No70471003);高等学校博士学科点专项科研基金(No200501080604);教育部科学技术研究重点项目(No206017);山西省重点实验室开放基金(No200603023)的资助

摘  要:非平衡数据集广泛存在于现实世界中,其分类问题已经成为目前数据挖掘领域中的一个研究热点。文章综述了非平衡数据集分类问题的评价方法及其常用分类算法,分析了目前存在的主要困难,并指出需进一步解决的几个问题。As the imbalanced data sets are widely used in the world, how to classify them has become a hot topic in the research field of data mining. The thesis summarizes the usual evaluation method and the algorithms which are used to classify the imbalanced data sets at present. Main difficulties and the questions which will be solved in the future are also shown in this paper.

关 键 词:非平衡数据集 分类 算法 

分 类 号:TP311.13[自动化与计算机技术—计算机软件与理论] TK124[自动化与计算机技术—计算机科学与技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象