基于特征映射的微博用户标签兴趣聚类方法  被引量:5

Micro-blog User Label Interest Clustering Method Based on Feature Mapping

在线阅读下载全文

作  者:秦雨[1,2] 余正涛[1,2] 王炎冰[1,2] 石林宾[1,2] 潘华山[1,2] 

机构地区:[1]昆明理工大学信息工程与自动化学院,昆明650500 [2]昆明理工大学智能信息处理重点实验室,昆明650500

出  处:《数据采集与处理》2015年第6期1246-1252,共7页Journal of Data Acquisition and Processing

基  金:国家自然科学基金(61175068)资助项目

摘  要:针对现有的用户兴趣聚类方法没有考虑用户标签之间存在的语义相关性问题,提出了一种基于特征映射的微博用户标签兴趣聚类方法。首先,获取待分析用户及其所关注用户的用户标签,选取出现频数高于设定阈值的标签构建模糊矩阵的特征维;然后,考虑标签之间的语义相关性,利用特征映射的思想将用户标签根据其与特征维标签之间的语义相似度映射到每个特征维下,计算每个特征维所对应的特征值;最后,利用模糊聚类得到了不同阈值下的用户兴趣聚类结果。实验结果表明,本文提出的基于特征映射的微博用户标签兴趣聚类方法有效地改善了用户兴趣聚类效果。Since many methods for cluster user interest does not consider the semantic similarity of the user labels,a micro-blog user label interest clustering method is introduced based on feature mapping.Firstly,the user labels of the target users and their focus users are obtained,then the labels with the higher frequency than the threshold value is chosen.Therefore,a feature space is created.Secondly,the user labels are mapped to the feature space by calculating the semantic similarity based on the feature mapping.Finally,the fuzzy clustering is utilized to obtain the clustering result of different threshold value.Experimental results show that the method greatly improves the clustering accuracy rate for user interest clustering.

关 键 词:微博 特征映射 模糊聚类 语义相似度 

分 类 号:TP391[自动化与计算机技术—计算机应用技术]

 

参考文献:

正在载入数据...

 

二级参考文献:

正在载入数据...

 

耦合文献:

正在载入数据...

 

引证文献:

正在载入数据...

 

二级引证文献:

正在载入数据...

 

同被引文献:

正在载入数据...

 

相关期刊文献:

正在载入数据...

相关的主题
相关的作者对象
相关的机构对象