基于改进CURE算法的不确定性移动用户数据聚类  被引量:8

An improved CURE algorithm based on the uncertainty of mobile user data clustering

在线阅读下载全文

作  者:高长元[1,2] 王海晶[1] 王京[1,2] 

机构地区:[1]哈尔滨理工大学管理学院,黑龙江哈尔滨150040 [2]哈尔滨理工大学高新技术产业发展研究中心,黑龙江哈尔滨150040

出  处:《计算机工程与科学》2016年第4期768-774,共7页Computer Engineering & Science

基  金:国家自然科学基金(71272191;71072085);黑龙江省自然科学基金(G201301);黑龙江省高等学校哲学社会科学创新团队建设计划(TD201203)

摘  要:随着云计算、大数据以及移动互联网的发展,移动终端用户数据呈现出数据量大、噪声大、动态性及不确定性增强的趋势,影响了移动用户数据聚类准确率与效率。针对上述问题,提出了一种改进的层次聚类算法CURE。该算法将原有算法中抽样处理数据的方式用Map Reduce函数实现并行化处理,同时结合区间数的概念,将移动用户数据用一个区间表示,计算其区间距离来适应移动用户数据的不确定性特点,从而提高聚类效率与准确率。最后利用MIT Reality项目数据集进行仿真,仿真结果表明了该方法的有效性及可行性,为移动用户数据的进一步利用及用户的个性化推荐提供支持。With the development of cloud computing,big data and mobile internet,mobile user data shows a trend of large data,big noise,increasing dynamic and uncertainty.This impacts the accuracy and efficiency of mobile user data clustering.As a result,we propose an improved custering using representatives(CRUE)algorithm to solve this problem.This algorithm converts the sampling method in the original algorithm,and uses the Map Reduce function to achieve parallel processing.In addition,an interval is used to represent the mobile user data by combining the concept of interval number.By calculating its interval distance to accommodate the uncertainty of mobile user data,the efficiency and accuracy of clustering are thereby improved.Finally this algorithm is applied on MIT Reality Project data set,and simulation results demonstrate the effectiveness and feasibility of the proposed algorithm.It provides support for the further use of mobile end-user data and user's personalized recommendation.

关 键 词:CURE 不确定性数据 移动用户数据 Map REDUCE 

分 类 号:TP301.6[自动化与计算机技术—计算机系统结构]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象