基于分辨粒度的gROC曲线分析方法  被引量:5

gROC Curve Analysis Method Based on Discernible Granularity

在线阅读下载全文

作  者:董元方[1,2] 李雄飞[1] 李军[1,3] 赵海英[4] 

机构地区:[1]符号计算与知识工程教育部重点实验室(吉林大学),吉林长春130012 [2]长春理工大学经济管理学院,吉林长春130022 [3]长春理工大学应用数学系,吉林长春130022 [4]北京邮电大学世纪学院,北京100083

出  处:《软件学报》2013年第1期109-120,共12页Journal of Software

基  金:国家自然科学基金(60863010;61163044);国家重点基础研究发展计划(973)(2010CB334709);吉林省科技发展计划(20090704)

摘  要:ROC曲线是模型选择的一种重要方法,但ROC曲线的不确定性影响了模型选择的准确性.基于分辨粒度,从反映得分的不确定性的角度提出gROC和gAUC的概念,从理论上讨论了gROC的若干性质.在给出其算法之后,利用双正态模型检验了gROC的合理性.在此基础上,提出了两个模型选择度量——AUC和AUC,并在UCI数据集上验证了该模型选择度量的高效性.实验结果表明,gROC能够有效反映ROC曲线的不确定性,基于AUC和AUC的模型选择方法优于基于AUC或sAUC的模型选择方法,在某些情况下,gROC具有更强的对分类器性能的比较能力.ROC Curve is an important method of model selection, but its uncertainty affects the accuracy of model selection. Based on discernible granularity and the view of reflecting the score's uncertainty, the study proposes the concept of gROC and gAUC, and discusses, theoretically, some properties of the gROC. The study also tests the reasonableness of gROC using binormal model after gave its algorithm. On this basis, the paper also proposes two model selection measures, λAUC and pAUC. The effieciency of these measures is verified based on UCI data sets. Experimental results show that the gROC can effectively reflect the uncertainty of ROC curve, and the model selection methods based on λAUC and pAUC are better than the method based on AUC or sAUC. In some cases, gROC has stronger capability on comparison of classifiers performance.

关 键 词:机器学习 模型选择 分类 ROC曲线 粒度 

分 类 号:TP181[自动化与计算机技术—控制理论与控制工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象