信用评分模型中稀有事件特殊采样处理方法探讨  被引量:4

Special Sampling Method of Rare Event in Credit Score Model

在线阅读下载全文

作  者:张景肖[1,2] 魏秋萍[1,2] 张波[1,2] 

机构地区:[1]中国人民大学应用统计研究中心,北京100872 [2]中国人民大学统计学院,北京100872

出  处:《统计与信息论坛》2012年第11期15-19,共5页Journal of Statistics and Information

基  金:国家社会科学基金青年项目<中国银行业信用风险管理的理论与实践--基于稀有事件和拒绝推断的信用评分模型>(09CTJ003);中国人民大学科学研究基金项目(中央高校基本科研业务费专项资金)<基于高频和超高维数据的中国金融市场若干重大问题研究>(10XNL007)

摘  要:信用评分模型的建模样本是由坏客户这一稀有事件和好客户这一大众事件组成的不平衡数据,故从模型残差的方差这一角度刻画稀有事件识别的难度,借鉴机器学习领域处理不平衡数据的方法,对建模样本中的稀有事件做特殊采样处理然后再建模,并证明对建模样本做特殊采样处理后必须用经验公式校正样本偏差。实证分析表明这是提高信用评分模型准确性的有效方法。The modeling samples of credit scoring models are unbalanced data consisted by the rare event of being a bad customer and the common event of being a good one. From the variance of model residual, the difficulty of rare event detection is depicted. The special sampling method applied in unbalanced data in machine learning is referenced to dealing with the modeling samples of credit scoring models. An empirical correction formula must be used to correct the sample bias caused by the special sampling is verified. The results of empirical study demonstrated the efficiency of this method.

关 键 词:信用评分模型 稀有事件 不平衡数据 特殊采样 

分 类 号:F222.3[经济管理—国民经济]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象