给“热力图”降温——谨慎使用Pearson相关系数  

在线阅读下载全文

作  者:李锋 朱训林 冯三营 

机构地区:[1]郑州大学数学与统计学院,河南郑州450001

出  处:《统计理论与实践》2024年第12期68-72,共5页STATISTICAL THEORY AND PRACTICE

基  金:国家社科基金项目“高维函数型回归模型的稳健统计推断及应用研究”(23BTJ061);河南省专业学位研究生精品教学案例项目“统计数据与分析方法”(YJS2024AL014);河南省专业学位研究生精品教学案例项目“机器学习与数据挖掘”(YJS2023AL009);河南省研究生优质课程项目“现代精算技术”(YJS2025KC06);郑州大学2023年研究生教育研究项目“应用统计专业硕士专题化教学模式研究”(YJSJY202309)。

摘  要:相关分析是开展数据分析、认识变量间统计规律性的重要内容与方法。Pearson相关系数是衡量两个连续变量间线性相关程度强弱的重要度量,热力图因其直观易读的呈现方式被广泛应用。但是,在计算Pearson相关系数时必须注意其适用条件。针对学生及部分数据分析工作者在数据分析报告、统计建模、毕业论文撰写中误用热力图的现象,通过模拟研究的方式,揭示忽略变量类型、忽视异常值、忽略线性相关性对Pearson相关系数的影响。模拟结果表明,忽视Pearson相关系数的适用条件,会导致得到不准确甚至是完全错误的结论。

关 键 词:Pearson相关系数 热力图 变量类型 异常值 线性关系 

分 类 号:O212[理学—概率论与数理统计]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象