检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:王晓阳[1] 张洪渊[2] 沈良忠[2] 池万乐[2]
机构地区:[1]温州大学物理与电子信息工程学院,浙江温州325035 [2]温州大学城市学院,浙江温州325035
出 处:《计算机技术与发展》2013年第5期30-33,共4页Computer Technology and Development
基 金:温州市科技局项目(KZ1102239)
摘 要:高维数据空间中的高维数据相似性度量问题是一个具有挑战性的课题。针对传统数据相似性度量算法在高维数据空间的不适应性,通过对传统的距离度量方法进行分析,结合高维数据特性,提出了高维数据相似性度量函数Esim(X,Y)。将其与已有的相似性度量函数Hsim(X,Y)进行比较,得出改进的算法在高维相似性度量方面的优越性,特别是在高值数据之间与低值数据之间的相对差异方面更具优势。利用数值型数据集进行实验分析,验证了该函数在高维数据空间聚类的有效性和合理性。The problem of similarity measurement for high dimensional data between high dimensional spaces is a challenging issue. Ai- ming at the problems of the inapplicability of the traditional measurement in high dimensional space,the improved function Esim( X, Y ) is proposed to measure the similarity between the data in high dimensional space through analyzing and summarizing the traditional meas- urement with the properties of high dimensional data. Advantages of the improved function are obvious between high dimensional space similarity measurement comparing with Hsim ( X, Y ), especially in high values and low values. The experiments by numerical dataset demonstrate that the function Esim( X, Y ) is effective and reasonable in high dimensional data clustering.
分 类 号:TP311.1[自动化与计算机技术—计算机软件与理论]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.3