高维混合型数据聚类算法研究  

在线阅读下载全文

作  者:郭小康 

机构地区:[1]西安建筑科技大学管理学院,陕西西安710050

出  处:《电子元器件与信息技术》2022年第3期69-71,共3页Electronic Component and Information Technology

摘  要:随着大规模数据收集技术、存储技术、网络技术以及信息技术的发展,越来越多的企业、组织和个人正逐步陷入数据泛滥但知识匮乏的困境中,聚类分析已经成为从大量冗余数据中提取有用信息的主要手段之一。目前,针对低维单类型数据的聚类算法研究已经相当成熟,但是,受“维度灾”的影响,许多针对低维数据的聚类算法往往不能应用于高维数据,对于混合型数据尤其明显。现实生活中高维数据又普遍存在,而且呈现逐步增多的趋势,比如:基因数据、网页数据、文本数据、多媒体数据、金融数据等,因此找到一种相对通用的聚类算法用于高维数据的聚类工作有着非常重要的现实意义,尤其是对高维混合型数据。针对这些问题,提出了一种子空间聚类算法,该算法综合考虑特征子空间和噪声子空间的信息,从而得到一个有效的子空间的自动搜索方式;进而又提出了一种能应用于混合型数据的相似度的度量方式,设计出了一种具有较好通用型的聚类算法,对高维数据进行聚类,该算法能应用于混合型数据聚类,具有一定的理论价值和现实指导意义。

关 键 词:聚类分析 高维数据 特征子空间 数据相似度 

分 类 号:TP312[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象