检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
作 者:徐文进[1] 马越 杜咏慧 XU Wenjin;MA Yue;DU Yonghui(School of Information Science and Technology,Qingdao University of Science and Technology,Qindao 266061)
机构地区:[1]青岛科技大学信息科学技术学院,青岛266061
出 处:《计算机与数字工程》2024年第6期1630-1635,1649,共7页Computer & Digital Engineering
基 金:山东省自然科学基金项目(编号:2018GGX105005)资助。
摘 要:在对交通数据的研究中经常会使用到聚类算法,且不同的聚类算法有不同的特性。K-means作为其中的一种聚类算法,具有较高的准确性和实用性,但其准确性易受主观选取K值和确定初始聚类中心的影响。为了优化聚类中心和K值的选取问题,提出MC-Kmeans算法。在所提方法中,首先通过Canopy算法选取K值,然后依据马氏距离的计算准则来确定初始聚类中心,最后将K值和聚类中心的值作为K-means的参数进行聚类。将MC-Kmeans算法应用到某时间段的纽约出租车交通数据中进行实际的验证。结果表明,与K-means算法比较,所提方法准确度更高,与实际交通情况更加相匹配,更能反映区域内的交通热点情况。Clustering algorithms are often used in the research of traffic data,and different clustering algorithms have differ-ent characteristics.As one of the clustering algorithms,K-means has high accuracy and practicability,but its accuracy is easily af-fected by subjective selection of K value and determination of initial clustering center.In order to optimize the selection of clustering center and K value,MC-Kmeans algorithm is proposed In the proposed method,firstly,the K value is selected by canopy algo-rithm,and then the initial cluster center is determined according to the calculation criterion of Mahalanobis distance.Finally,the K value and the value of cluster center are clustered as the parameters of K-means MC-Kmeans algorithm is applied to New York taxi traffic data in a certain period of time for practical verification.The results show that compared with K-means algorithm,the pro-posed method has higher accuracy,better matches the actual traffic situation,and can better reflect the traffic hot spots in the re-gion.
关 键 词:K-MEANS Canopy算法 马氏距离 交通
分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.28