检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]澳门科技大学商学院决策科学系,中国澳门氹仔999078 [2]广西财经学院大数据与人工智能学院,广西南宁530007 [3]广西财经学院教务处,广西南宁530007 [4]广西财税大数据分析工程研究中心,广西南宁530007 [5]广西财经学院网络与信息技术中心,广西南宁530007
出 处:《企业科技与发展》2023年第11期97-105,共9页Sci-Tech & Development of Enterprise
基 金:国家自然科学基金资助项目(71862003);应用经济学广西一流学科建设项目基金资助(2022GSXKA01);广西财税大数据分析工程研究中心建设资助。
摘 要:文章为解决客户流失预测中因数据类别高度不平衡导致模型性能降低的问题,基于Bagging集成思想,提出一种融合聚类随机采样、代价敏感的预测模型(RWBC-Ensemble)。首先,利用聚类随机采样方法降低数据的不平衡度;其次,将流失客户样本划分为安全样本和危险样本,并为不同类别的样本赋予不同的权重;最后,以代价敏感的梯度提升决策树为基学习器,对采样数据进行预测。此外,研究在RWBC-Ensemble融入特征选择、数据清洗2个模块,进一步提高数据质量。根据4个高度不平衡客户数据上的实验结果,RWBC-Ensemble的AUC、Recall平均提升了3.76%、19.92%,但由于搜集数据的困难性,未能在更多不平衡客户流失的数据上验证该模型的有效性。研究结果表明,该模型拥有更好的客户流失预测性能,对提高客户留存率具有重要作用,为企业制定和实施客户留存策略提供重要参考依据。
关 键 词:客户流失预测 不平衡数据 随机采样 代价敏感学习 集成学习
分 类 号:F626[经济管理—产业经济] F274[自动化与计算机技术—控制理论与控制工程] TP181[自动化与计算机技术—控制科学与工程]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.7