不等距划分的高维相似性度量方法研究  被引量:3

Similarity Measurement in High Dimensional Space Based on Unequally Spaced Partition

在线阅读下载全文

作  者:谢明霞[1,2] 王家耀[1] 郭建忠[1] 陈科[1] 

机构地区:[1]信息工程大学测绘学院 [2]75719部队

出  处:《武汉大学学报(信息科学版)》2012年第7期780-783,共4页Geomatics and Information Science of Wuhan University

基  金:国家863计划资助项目(2009AA12Z228);数字制图与国土信息应用工程国家测绘地理信息局重点实验室开放研究基金资助项目(GCWD201105)

摘  要:介绍了现有的高维相似性度量的改进方法,对其中存在的问题进行了分析说明,然后利用不等距维区间划分对相似性度量函数PIDist(X,Y,kd)进行改进,并对UCI提供的机器学习数据库中的heart-statlog和vehicle数据集进行聚类分析对比实验,实验结果验证了改进高维相似性度量方法的正确性和有效性。Because of the curse of dimensionality, the traditional similarity measurement has been unfit for the high dimensional space. And the equally spaced partition can't represent the data distribution, so the similarity measurement based on that can't compute the similarity between high dimensional data reasonably. Aimed at these problems, the existing improved similarity measurements for high dimensional space are introduced firstly, and the problems are analyzed. Then, improves the similarity measurement PIDist(X,Y,kd) based on unequally spaced partition of each dimension. Finally, the experimental result of clustering heart-statlog and vehicle data sets provided by UCI proves the validity of the proposed similarity measurement.

关 键 词:高维空间 相似性度量 不等距划分 

分 类 号:P208[天文地球—地图制图学与地理信息工程]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象