论聚类分析中聚类标准化与正交化的必要性  

在线阅读下载全文

作  者:杜子芳[1] 刘亚文[1] 徐一丁[1] 

机构地区:[1]中国人民大学统计学院,北京100872

出  处:《统计与决策》2012年第11期15-18,共4页Statistics & Decision

基  金:教育部人文社会科学重点研究基地2009年重大项目(2009JJD910001)

摘  要:聚类分析是三大多元统计分析方法之一,在许多领域都有广泛的应用,特别是在模式识别或无学习分类领域,发挥着不可替代的作用。除谱系聚类的ward方法外,聚类分析的关键依据是样品间距。样品间距完全脱胎于几何中的距离概念,但样品间距在几何距离三角可加性里所隐含的各变量量纲必须一致且必须正交的两个关键特性或许是有意或许是不经意地被模糊了。文章认为各变量量纲一致且正交应是聚类分析的强制要求,而主成分分析是正交化的最佳手段,应该成为聚类分析程序相关模块的缺省设置或唯一选项。

关 键 词:聚类分析 距离 正交化 

分 类 号:O212.4[理学—概率论与数理统计]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象