聚类随机采样和代价敏感的电信客户流失预测集成模型  被引量:1

在线阅读下载全文

作  者:李毅 马文斌[3,4] 李国祥 

机构地区:[1]澳门科技大学商学院决策科学系,中国澳门氹仔999078 [2]广西财经学院大数据与人工智能学院,广西南宁530007 [3]广西财经学院教务处,广西南宁530007 [4]广西财税大数据分析工程研究中心,广西南宁530007 [5]广西财经学院网络与信息技术中心,广西南宁530007

出  处:《企业科技与发展》2023年第11期97-105,共9页Sci-Tech & Development of Enterprise

基  金:国家自然科学基金资助项目(71862003);应用经济学广西一流学科建设项目基金资助(2022GSXKA01);广西财税大数据分析工程研究中心建设资助。

摘  要:文章为解决客户流失预测中因数据类别高度不平衡导致模型性能降低的问题,基于Bagging集成思想,提出一种融合聚类随机采样、代价敏感的预测模型(RWBC-Ensemble)。首先,利用聚类随机采样方法降低数据的不平衡度;其次,将流失客户样本划分为安全样本和危险样本,并为不同类别的样本赋予不同的权重;最后,以代价敏感的梯度提升决策树为基学习器,对采样数据进行预测。此外,研究在RWBC-Ensemble融入特征选择、数据清洗2个模块,进一步提高数据质量。根据4个高度不平衡客户数据上的实验结果,RWBC-Ensemble的AUC、Recall平均提升了3.76%、19.92%,但由于搜集数据的困难性,未能在更多不平衡客户流失的数据上验证该模型的有效性。研究结果表明,该模型拥有更好的客户流失预测性能,对提高客户留存率具有重要作用,为企业制定和实施客户留存策略提供重要参考依据。

关 键 词:客户流失预测 不平衡数据 随机采样 代价敏感学习 集成学习 

分 类 号:F626[经济管理—产业经济] F274[自动化与计算机技术—控制理论与控制工程] TP181[自动化与计算机技术—控制科学与工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象