基于相似性度量的高维数据聚类算法研究  被引量:13

Research on High Dimensional Clustering Algorithm Based on Similarity Measurement

在线阅读下载全文

作  者:王晓阳[1] 张洪渊[2] 沈良忠[2] 池万乐[2] 

机构地区:[1]温州大学物理与电子信息工程学院,浙江温州325035 [2]温州大学城市学院,浙江温州325035

出  处:《计算机技术与发展》2013年第5期30-33,共4页Computer Technology and Development

基  金:温州市科技局项目(KZ1102239)

摘  要:高维数据空间中的高维数据相似性度量问题是一个具有挑战性的课题。针对传统数据相似性度量算法在高维数据空间的不适应性,通过对传统的距离度量方法进行分析,结合高维数据特性,提出了高维数据相似性度量函数Esim(X,Y)。将其与已有的相似性度量函数Hsim(X,Y)进行比较,得出改进的算法在高维相似性度量方面的优越性,特别是在高值数据之间与低值数据之间的相对差异方面更具优势。利用数值型数据集进行实验分析,验证了该函数在高维数据空间聚类的有效性和合理性。The problem of similarity measurement for high dimensional data between high dimensional spaces is a challenging issue. Ai- ming at the problems of the inapplicability of the traditional measurement in high dimensional space,the improved function Esim( X, Y ) is proposed to measure the similarity between the data in high dimensional space through analyzing and summarizing the traditional meas- urement with the properties of high dimensional data. Advantages of the improved function are obvious between high dimensional space similarity measurement comparing with Hsim ( X, Y ), especially in high values and low values. The experiments by numerical dataset demonstrate that the function Esim( X, Y ) is effective and reasonable in high dimensional data clustering.

关 键 词:高维数据 相似性度量 数据聚类 

分 类 号:TP311.1[自动化与计算机技术—计算机软件与理论]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象