检索规则说明:AND代表“并且”;OR代表“或者”;NOT代表“不包含”;(注意必须大写,运算符两边需空一格)
检 索 范 例 :范例一: (K=图书馆学 OR K=情报学) AND A=范并思 范例二:J=计算机应用与软件 AND (U=C++ OR U=Basic) NOT M=Visual
机构地区:[1]烟台大学计算机与控制工程学院,山东烟台264005
出 处:《计算机应用与软件》2015年第11期232-237,共6页Computer Applications and Software
基 金:国家自然科学基金项目(61170224;61403329);山东省科技发展计划项目(2012GGB01017);山东省自然科学基金项目(ZR2012FL07;ZR2013FQ020)
摘 要:微博作为发展最迅猛的信息传播平台,每天都会产生大量数据,迅速增长的数据对数据处理提出了新的要求。针对微博数据特点,对VSM模型进行改进,并在MapReduce平台上,设计微博热点话题发现并行模糊C均值(HTD-PFCM)算法。实验结果表明,基于改进VSM模型的HTD-PFCM算法具有良好的加速比,并且能够更高效地处理微博数据,发现微博热点话题。As the fastest growing information dissemination platform, microblogs produce large amounts of data every day. With the rapid growth of data, new requirement on data processing is requested. According to the characteristics of microblogging data, we improved VSM model, and designed on MapReduce platform a parallel fuzzy c-means algorithm for hot microblogging topics discovery (HTD-PFCM). Experimental result showed that the HTD-PFCM algorithm based on the improved VSM model has a good speedup, and can handle the microblogging data more efficiently to find the hot topics of microblogs.
关 键 词:微博热点发现 并行FCM聚类算法 改进的VSM模型MapReduce框架
分 类 号:TP3[自动化与计算机技术—计算机科学与技术]
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在载入数据...
正在链接到云南高校图书馆文献保障联盟下载...
云南高校图书馆联盟文献共享服务平台 版权所有©
您的IP:216.73.216.46