基于属性维划分和MapReduce的道路运输信息系统数据聚类  被引量:1

Data Clustering of Road Transportation Information System Based on Attribute Dimension Partition and MapReduce

在线阅读下载全文

作  者:郑晓峰[1] 徐建闽[1] 卢凯[1] 

机构地区:[1]华南理工大学土木与交通学院,广东广州510640

出  处:《华南理工大学学报(自然科学版)》2014年第8期122-128,135,共8页Journal of South China University of Technology(Natural Science Edition)

基  金:国家自然科学基金资助项目(61174184);广东省工业科技攻关计划项目(2008B010200010);广州市科技支撑项目(2011J4300045)

摘  要:针对基于密度的带有噪声空间聚类分析(DBSCAN)的不足,融合了领域知识和划分思想,提出了属性维划分的概念,并论证了基于局部簇合并与核心点计算的剪枝原理,最后结合云计算编程模式MapReduce的特点,给出了DBSCAN的优化方法,并在实际道路运输信息系统数据的聚类分析中得到应用验证.实践证明划分后的数据集易于实现并行聚类数据挖掘,文中优化方法优于一般的统计分析方法.Aiming at the shortcomings of DBSCAN( Density-Based Spatial Clustering of Applications with Noise),this paper presents the concept of the attribute dimension partition by integrating the domain knowledge with the partition idea. Then,the principles of the cluster merging and the pruning computation are demonstrated. Finally,an optimization method of DBSCAN is put forward based on the cloud computing programming model MapReduce,and the optimization method is verified through the data clustering of a real road transport information system. It is found that the dataset partition helps to perform the concurrent computation,and the proposed optimization method is superior to common statistical methods.

关 键 词:道路运输 DBSCAN 属性维 划分 MAPREDUCE 聚类 

分 类 号:U495[交通运输工程—交通运输规划与管理]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象